找到 413 篇文章,关于数据挖掘

离群点检验是如何工作的?

Ginni
更新于 2021年11月24日 06:38:13

330 次查看

统计离群点检验分析两个假设;一个工作假设和一个备择假设。工作假设 H 是一个陈述,即 n 个对象的整个数据集来自一个初始分布模型 F,即 H:oi Î F,其中 i = 1, 2, n。如果没有任何统计上重要的证据支持拒绝该假设,则保留该假设。离群点检验检查对象 oi 相对于分布 F 是否本质上很大(或很小)。根据对数据的可用知识,已经提出了不同的检验统计量用于作为离群点检验。假设某些统计量... 阅读更多

聚类的常用方法有哪些?

Ginni
更新于 2021年11月24日 06:36:03

2K+ 次查看

聚类的方法多种多样,如下所示:分区方法 - 给定一个包含 n 个对象或数据元组的数据库,分区方法将信息划分为 k 个分区,其中每个分区定义一个聚类,并且 k < n。它可以将数据分配到 k 个组中,这些组可以满足以下必要条件:每个组必须至少包含一个对象。每个对象都应该准确地属于一个组。给定 k,要构建的分区的数量,分区方法会进行初始分区。然后,它使用迭代重定位方法,该方法试图通过转换... 阅读更多

聚类的应用有哪些?

Ginni
更新于 2021年11月24日 06:31:46

3K+ 次查看

聚类的应用多种多样,如下所示:可扩展性 - 一些聚类算法在包含不到 200 个数据对象的小型数据集中效果很好;但是,一个大型数据库可能包含数百万个对象。对给定大型数据集的样本进行聚类会导致偏差结果。需要高度可扩展的聚类算法。处理不同类型属性的能力 - 一些算法旨在对基于区间的(数值)记录进行聚类。但是,应用程序可能需要对多种类型的数据进行聚类,包括二进制数据、分类(名义)数据和有序数据,或者这些数据类型的组合。发现... 阅读更多

数据挖掘面临哪些挑战?

Ginni
更新于 2021年11月24日 06:27:45

1K+ 次查看

数据挖掘面临着各种挑战,如下所示:数据挖掘算法的效率和可扩展性 - 它可以有效地从数据库中的大量数据中提取数据,知识发现算法应该对大型数据库具有效率和可扩展性。具体来说,数据挖掘算法的运行时间应该在大型数据库中是可预测的和可接受的。具有指数或甚至通道阶多项式复杂度的算法将无法有效使用。数据挖掘结果的有用性、确定性和表达性 - 识别出的知识应该准确地反映数据库的内容,并对特定应用有用。... 阅读更多

数据挖掘的社会影响是什么?

Ginni
更新于 2021年11月24日 06:26:09

10K+ 次查看

数据挖掘是通过使用包括统计和数学技术在内的模式识别技术,通过传输存储在存储库中的大量数据来查找有用的新相关性、模式和趋势的过程。它是对事实数据集的分析,以发现意想不到的关系,并以对数据所有者既合乎逻辑又有帮助的新方法来总结记录。数据挖掘系统旨在促进将个人识别和分类到不同的群体或细分市场中。从商业公司的角度来看,以及可能对整个行业而言,它可以解释使用... 阅读更多

什么是数据挖掘指标?

Ginni
更新于 2021年11月24日 06:24:15

8K+ 次查看

数据挖掘是人工智能的一种形式,它使用感知模型、分析模型和多种算法来模拟人脑的技术。数据挖掘支持机器做出人类决策并创建人类选择。数据挖掘工具的用户将不得不指导机器规则、偏好,甚至经验才能拥有决策支持数据挖掘指标如下:有用性 - 有用性涉及多个指标,这些指标告诉我们模型是否提供了有用的数据。例如,将保存位置与销售额相关联的数据挖掘模型既可以准确又可靠,... 阅读更多

KDD 的过程是什么?

Ginni
更新于 2021年11月24日 05:51:58

903 次查看

KDD 代表数据库中的知识发现。它定义了在数据中发现知识的广泛过程,并强调了特定数据挖掘技术的更高级别应用。它是多个领域的研究人员感兴趣的领域,例如人工智能、机器学习、模式识别、数据库、统计学、专业系统的知识获取以及数据可视化。知识发现过程是迭代的和交互式的,包括九个步骤。该过程在每个阶段都是迭代的,这意味着可能需要转换回之前的操作。该过程在某种意义上具有多种想象力方法,即人们无法提出一个公式或创建... 阅读更多

什么是 KDD?

Ginni
更新于 2021年11月24日 05:49:42

2K+ 次查看

KDD 代表数据库中的知识发现。它定义了在数据中发现知识的广泛过程,并强调了特定数据挖掘技术的更高级别应用。它是多个领域的研究人员感兴趣的领域,例如人工智能、机器学习、模式识别、数据库、统计学、专业系统的知识获取以及数据可视化。KDD 过程的主要目标是从大型数据库的上下文中提取信息中的数据。它通过利用数据挖掘算法来识别被认为是知识的内容来做到这一点。数据库中的知识发现被视为程序化、探索性分析和... 阅读更多

数据挖掘的历史是什么?

Ginni
更新于 2021年11月24日 05:47:25

886 次查看

数据挖掘是通过使用包括统计和数学技术在内的模式识别技术,通过传输存储在存储库中的大量数据来查找有用的新相关性、模式和趋势的过程。它是对事实数据集的分析,以发现意想不到的关系,并以对数据所有者既合乎逻辑又有帮助的新方法来总结记录。它是选择、探索和建模大量信息以查找最初未知的规律或关系的过程,以便为数据库所有者获得清晰且有益的结果。数据挖掘类似于... 阅读更多

为什么我们需要 KDD?

Ginni
更新于 2021年11月24日 05:46:03

425 次查看

将数据转化为知识的传统技术依赖于手动分析和解释。例如,在医疗保健行业,专家每季度系统地分析医疗保健数据中的当前趋势和变化是常见的。专家向赞助的医疗保健组织提供一份详细说明分析的报告;该报告成为医疗保健管理未来决策和计划的基础。有几种类型的应用程序,包括行星地质学家仔细筛选行星和小行星的遥感图像,仔细定位和编目诸如撞击坑之类的感兴趣的地质物体。这种对数据的手动探测形式... 阅读更多

广告