2K+ 阅读量
KDD 代表数据库中的知识发现。它定义了在数据中发现知识的广泛过程,并强调了特定数据挖掘技术的较高层应用。它是许多领域的研究人员感兴趣的领域,例如人工智能、机器学习、模式识别、数据库、统计学、专业系统知识获取和数据可视化。KDD 过程的主要目标是从大型数据库中的信息中提取数据。它通过利用数据挖掘算法来识别被认为是知识的内容来实现这一点。数据库中的知识发现被视为一种程序化的、探索性的分析,并且... 阅读更多
886 阅读量
数据挖掘是通过传输存储在存储库中的大量数据来查找有用的新相关性、模式和趋势的过程,使用模式识别技术,包括统计和数学技术。它是对事实数据集的分析,以发现意想不到的关系并以新颖的方式总结记录,这些方式对数据库所有者既合乎逻辑又有所帮助。它是选择、探索和建模大量信息的过程,以查找最初未知的规律或关系,以获得对数据库所有者清晰且有益的结果。数据挖掘类似于... 阅读更多
425 阅读量
将数据转化为知识的传统技术依赖于手动分析和解释。例如,在医疗保健行业,专家们习惯于每季度系统地分析医疗保健数据的当前趋势和变化。专家们会向赞助的医疗保健组织提交一份详细说明分析结果的报告;这份报告成为未来医疗保健管理决策和计划的基础。有几种类型的应用程序,包括行星地质学家筛选行星和小行星的遥感图像,仔细定位和编目诸如撞击坑之类的感兴趣的地质物体。这种对数据的手动探测形式... 阅读更多
1K+ 阅读量
数据仓库是一种通常用于从多个来源收集和管理数据以向企业提供有意义的业务洞察力的技术。数据仓库专门为支持管理决策的目标而创建。简单来说,数据仓库定义了一个独立于组织运营数据库维护的数据库。数据仓库系统能够集成多个应用程序系统。它们通过支持一个可靠的合并历史数据分析平台来提供数据处理。有各种类型的数据仓库用户,如下所示 -统计学家 -通常只有少数... 阅读更多
3K+ 阅读量
数据仓库数据库数据仓库是一种通常用于从多个来源收集和管理数据以向企业提供有意义的业务洞察力的技术。数据仓库专门为支持管理决策的目标而创建。简单来说,数据仓库定义了一个独立于组织运营数据库维护的数据库。数据仓库系统能够集成多个应用程序系统。它们通过支持一个可靠的合并历史数据分析平台来提供数据处理。数据仓库通过支持 OLTP 数据库卸载数据的位置来提供 OLTP 系统... 阅读更多
305 阅读量
数据仓库定义了一个独立于组织运营数据库维护的数据库。数据仓库系统能够集成多个应用程序系统。它们通过支持一个可靠的合并历史记录分析平台来支持数据处理。数据仓库可以被视为一组物化视图,这些视图表示在远程基本关系上。当查询正式化时,它是在本地使用物化视图计算的,无需访问初始数据源。数据仓库是一个随着时间推移而不断演变的活动实体。随着时间的推移,需要回答新的查询。各种查询... 阅读更多
6K+ 阅读量
在数据仓库过程中,数据分段区域由数据分段服务器软件和提取、转换和加载活动结果的数据存储存档(存储库)组成。数据分段服务器软件临时保存和更改从 OLTP 数据源提取的数据,而存档存储库存储已清理、转换的数据和属性,以便加载到数据市场和数据仓库中。数据分段过程将信息导入为流或文件,对其进行更改,生成集成的清理数据,并将其分段以加载到数据仓库、数据市场或操作数据存储中。数据分段工具是可访问的,并且... 阅读更多
数据仓库是一种通常用于从各种其他来源收集和处理数据以向企业提供有意义的业务洞察力的方法。数据仓库专门为支持管理决策的目标而创建。数据仓库有两个主要部分,如下所示 -物理存储 -可以使用 SQL 查询查询的 Microsoft SQL Server 数据库,以及需要运行报告的 OLAP 数据库。逻辑架构 -映射到物理存储中数据的概念模型。物理存储数据仓库的物理存储包含一个数据库... 阅读更多
元数据中心用于处理决策处理产品之间技术元数据的交换和分发。它主要供技术人员在数据仓库的增长和维护期间使用。该中心的四个要求是 -元数据中心应在共享元数据环境中提供系统和产品之间元数据的交换。该中心必须具有记录和开放的程序化对象接口(例如,使用 COM 或 CORBA),允许第三方工具控制中心的各种服务。支持行业识别文件格式(逗号分隔... 阅读更多
215 阅读量
数据仓库体系结构展示了数据的多个层,其中一层的数据是从较低层的数据转换而来的。数据源(也称为存储在开放数据库中)形成最低层。它们包括存储在开放数据库系统和遗留系统中的结构化数据,或存储在文件中的非结构化或半结构化数据。有几种类型的成功与数据仓库相关,如下所示 -经济成功 -数据仓库对底线有特定影响。政治成功 -人们喜欢所做的事情。如果不需要数据仓库,它... 阅读更多