3000+ 次浏览
聚类有各种各样的应用,如下所示:可扩展性 - 一些聚类算法在小型数据集(包括少于 200 个数据对象)中效果很好;然而,大型数据库可能包含数百万个对象。对给定大型数据集的样本进行聚类可能会导致结果偏差。需要高度可扩展的聚类算法。处理不同类型属性的能力 - 一些算法旨在对基于区间的(数值)记录进行聚类。但是,应用程序可能需要对多种类型的数据进行聚类,包括二元数据、分类(名义)数据和有序数据,或者这些数据类型的组合。发现……阅读更多
1000+ 次浏览
数据挖掘的挑战有很多,如下所示:数据挖掘算法的效率和可扩展性 - 它可以有效地从数据库中的大量数据中提取数据,知识发现算法应该对大型数据库具有高效性和可扩展性。具体来说,数据挖掘算法的运行时间应该在大型数据库中是可预测和可接受的。具有指数级甚至通道级多项式复杂度的算法将不会有效使用。数据挖掘结果的有用性、确定性和表达性 - 已识别的知识应该准确地描绘数据库的内容,并对特定应用有益……阅读更多
10000+ 次浏览
数据挖掘是通过使用包括统计和数学技术在内的模式识别技术,通过大量存储在存储库中的数据来查找有用的新相关性、模式和趋势的过程。它是对事实数据集的分析,以发现意想不到的关系,并以对数据所有者既有逻辑又有帮助的新方法来总结记录。数据挖掘系统旨在促进将个人识别和分类到不同的群体或细分市场。从商业公司的角度来看,也可能对整个行业而言,它可以解释……阅读更多
8000+ 次浏览
数据挖掘是人工智能的一种形式,它使用感知模型、分析模型和多种算法来模拟人脑的技术。数据挖掘支持机器做出人类的决策并创造人类的选择。数据挖掘工具的用户将不得不指导机器规则、偏好甚至经验,以获得决策支持数据挖掘指标如下:有用性 - 有用性涉及多个指标,这些指标告诉我们模型是否提供了有用的数据。例如,将保存位置与销售额关联起来的数据挖掘模型可以既准确又可靠……阅读更多
903 次浏览
KDD 代表数据库中的知识发现。它定义了在数据中发现知识的广泛过程,并强调了特定数据挖掘技术的顶级应用。它是多个领域研究人员感兴趣的领域,例如人工智能、机器学习、模式识别、数据库、统计学、专业系统的知识获取和数据可视化。知识发现过程是迭代的和交互式的,包括九个步骤。该过程在每个阶段都是迭代的,这意味着可能需要转换回之前的操作。该过程在某种意义上具有多种富有想象力的方法,因为人们无法提出一个公式或创建一个……阅读更多
2000+ 次浏览
KDD 代表数据库中的知识发现。它定义了在数据中发现知识的广泛过程,并强调了特定数据挖掘技术的顶级应用。它是多个领域研究人员感兴趣的领域,例如人工智能、机器学习、模式识别、数据库、统计学、专业系统的知识获取和数据可视化。KDD 过程的主要目标是从大型数据库环境中的信息中提取数据。它通过利用数据挖掘算法来识别被认为是知识的内容来实现这一点。数据库中的知识发现被视为一种程序化的、探索性的分析……阅读更多
886 次浏览
数据挖掘是通过使用包括统计和数学技术在内的模式识别技术,通过大量存储在存储库中的数据来查找有用的新相关性、模式和趋势的过程。它是对事实数据集的分析,以发现意想不到的关系,并以对数据所有者既有逻辑又有帮助的新方法来总结记录。它是选择、探索和建模大量信息以查找最初未知的规律或关系的过程,以便为数据库所有者获得清晰且有益的结果。数据挖掘类似于……阅读更多
425 次浏览
将数据转化为知识的传统技术依赖于手动分析和解释。例如,在医疗保健行业,专家每季度系统地分析医疗保健数据的当前趋势和变化是很常见的。专家们会向赞助的医疗保健组织提交一份详细说明分析的报告;这份报告成为医疗保健管理未来决策和规划的基础。有几种类型的应用程序,包括行星地质学家仔细筛选行星和小行星的遥感图像,仔细定位和编目诸如撞击坑之类的感兴趣的地质物体。这种对数据的手动探测……阅读更多
数据仓库是一种通常用于从多个来源收集和管理数据的技术,为企业提供有意义的业务洞察力。数据仓库是专门为支持管理决策的目标而创建的。简单来说,数据仓库定义了一个独立于组织运营数据库维护的数据库。数据仓库系统能够集成多个应用程序系统。它们通过为分析提供可靠的整合历史数据平台来提供数据处理。有各种类型的数据仓库用户,如下所示:统计学家 - 通常只有少数……阅读更多
数据仓库数据库数据仓储是一种常用的技术,用于从多个来源收集和管理数据,为企业提供有意义的商业洞察。数据仓库专门为支持管理决策的目标而创建。简单来说,数据仓库定义了一个独立于组织运营数据库的数据库。数据仓库系统能够集成多个应用程序系统。它们通过支持一个可靠的、整合的历史数据平台来进行数据处理和分析。数据仓库通过为OLTP数据库提供卸载数据的地方来提供OLTP系统……阅读更多