找到 413 篇文章 关于数据挖掘

为什么商业分析师需要数据仓库?

Ginni
更新于 2021年11月22日 07:38:15

380 次浏览

数据仓库是一种主要用于收集和管理来自各种来源的数据的技术,以便为企业提供有意义的商业洞察。数据仓库专门设计用于支持管理决策。简单来说,数据仓库定义了一个独立于组织运营数据库维护的数据库。数据仓库系统能够集成多个应用程序系统。它们通过支持一个可靠的、整合的历史信息分析平台来提供数据处理。数据仓库的技术包括数据清洗、数据集成和联机分析处理 (OLAP),即具有诸如……功能的分析技术 阅读更多

数据仓库的组成部分是什么?

Ginni
更新于 2021年11月22日 07:36:42

3K+ 次浏览

数据仓库的主要组成部分如下:数据源 - 数据源定义了一个电子记录库,其中包含对管理使用或分析感兴趣的数据。数据库的主机(例如 IBM DB2、ISAM、Adabas、Teradata 等)、客户机-服务器数据库(例如 Teradata、IBM DB2、Oracle 数据库、Informix、Microsoft SQL Server 等)、PC 数据库(例如 Microsoft Access、Alpha Five)、电子表格(例如 Microsoft Excel)以及任何其他电子数据存储。数据仓库 - 数据仓库通常是关系数据库。它应该被组织成以最支持查询和……的方式保存数据 阅读更多

为什么我们需要一个单独的数据仓库?

Ginni
更新于 2021年11月22日 07:35:16

5K+ 次浏览

数据仓库是一种主要用于收集和管理来自各种来源的数据的技术,以便为企业提供有意义的商业洞察。数据仓库专门设计用于支持管理决策。简单来说,数据仓库指的是一个独立于组织运营数据库维护的数据库。数据仓库系统能够集成多个应用程序系统。它们通过支持一个可靠的、整合的历史信息分析平台来提供数据处理。数据仓库查询很复杂,因为它们包含在汇总级别计算大量信息。它可能需要使用…… 阅读更多

运营数据库和数据仓库的区别?

Ginni
更新于 2021年11月22日 08:41:43

730 次浏览

运营数据库运营数据库是数据仓库的数据来源。它包含用于运行企业正常运营的详细信息数据。数据通常会在创建更新时发生变化,并反映最终交易的最新值。它也称为 OLTP(联机事务处理数据库),用于实时管理动态数据。运营数据库的要求仅仅是控制信息的插入和更新,以及对数据操作和查看机制的有效访问。数据仓库数据仓库系统为用户或知识工作者提供数据分析和决策支持。此类系统可以构建…… 阅读更多

什么是数据仓库?

Ginni
更新于 2021年11月22日 07:32:04

769 次浏览

数据仓库是一种主要用于收集和管理来自各种来源的数据的技术,以便为企业提供有意义的商业洞察。数据仓库专门设计用于支持管理决策。简单来说,数据仓库定义了一个独立于组织运营数据库维护的数据库。数据仓库系统能够集成多个应用程序系统。它们通过提供一个可靠的、整合的历史信息分析平台来提供数据处理。数据仓库在多维空间中概括和集中数据。数据仓库的构建包含数据清洗、数据集成和数据转换,并且可以…… 阅读更多

什么是数据立方体聚合?

Ginni
更新于 2021年11月22日 07:27:09

5K+ 次浏览

数据集成是将来自多个不同来源的数据合并的过程。在执行数据集成时,它必须处理数据冗余、不一致、重复等问题。在数据挖掘中,数据集成是一种记录预处理方法,包括将来自多个异构数据源的数据合并成一致的数据,以保留和提供数据的统一视角。数据集成在医疗保健行业尤为重要。来自多个患者记录和诊所的集成数据通过将来自多个系统的信息集成到对有益信息的单一视角中,帮助临床医生识别医疗疾病和疾病,从而…… 阅读更多

分类数据的离散化和概念层次生成的技术是什么?

Ginni
更新于 2021年11月19日 12:25:37

1K+ 次浏览

分类数据是离散数据。分类属性具有固定数量的不同值,这些值之间没有顺序,包括地理区域、工作类别和项目类型。生成分类数据概念层次结构的各种方法如下:用户或专家在模式级别显式指定属性的部分排序 - 分类属性或维度的概念层次结构通常包含一组属性。用户或专业人员可以通过在模式级别定义属性的部分或全部排序来简单地表示概念层次结构。例如,一个…… 阅读更多

数值数据的离散化和概念层次生成的技术是什么?

Ginni
更新于 2021年11月19日 12:20:34

2K+ 次浏览

由于适用数据范围的广泛多样性和数据值的频繁更新,为数值属性定义概念层次结构是复杂且费力的。数值数据概念层次生成有各种方法,如下所示:分箱 - 分箱是一种基于定义数量的箱的自顶向下拆分技术。这些方法也用作用于数值减少和概念层次生成的离散化方法。这些技术可以递归地应用于生成的划分以创建概念层次结构。分箱不使用类数据,因此是一种无监督的离散化技术。它…… 阅读更多

什么是数据离散化?

Ginni
更新于 2021年11月19日 12:19:05

5K+ 次浏览

数据离散化技术可用于通过将属性的范围划分为区间来减少给定连续属性的值的数量。可以使用区间标签来恢复实际数据值。它可以恢复具有少量区间标签的连续属性的多个值,因此减少并简化了原始信息。这导致了简洁、易于使用、知识级别的挖掘结果表示。离散化技术可以根据离散化的实现方式进行分类,例如它是否使用类数据或它进行的方向(即自顶向下与自底向上)。如果…… 阅读更多

降维和数值归约的区别?

Ginni
更新于 2021年11月19日 12:17:47

715 次浏览

降维
在降维中,使用数据编码或转换来访问原始数据的简化或“压缩”表示。如果可以从压缩数据中无损地重建原始数据,则数据缩减称为无损的。如果重建的数据只是原始数据的近似值,则数据缩减称为有损的。
离散小波变换 (DWT) 与离散傅里叶变换 (DFT) 密切相关,DFT 是一种包含正弦和余弦的信号处理技术。一般来说,DWT 可以实现更好的有损压缩。也就是说,如果为 DWT 保持相似数量的系数……阅读更多

广告