找到 413 篇文章 关于数据挖掘

如何区分不同的类别?

Ginni
更新于 2022年2月15日 07:04:13

547 次浏览

阶级歧视被定义为阶级主义。它是基于社会阶层的偏见或歧视。它涉及个人态度、行为、政策体系和实践,这些体系和实践是为了让上层阶级受益,而下层阶级则受到损害。阶级主义可以定义为针对下层阶级的个人偏见和制度性阶级主义,就像种族主义一词可以严格地定义为个人偏见或制度性种族主义一样。后者被描述为我们社会中多个机构中意识或无意识的阶级主义是如何明显的。“阶级歧视可以在多种媒体形式中看到,包括电视节目、电影,以及…… 阅读更多

数据泛化和分析泛化的例子是什么?

Ginni
更新于 2022年2月15日 07:01:54

1K+ 次浏览

数据泛化通过用高级概念(包括年轻、中年和老年)替换相对低级的值(包括属性年龄的数值)来汇总数据。因此,它是一个从相对较低的概念级别到较高的概念级别,从数据库中抽象出一组大量任务相关信息的过程。以下是用于高效灵活地泛化大型数据集的两种方法:OLAP 方法 - 数据立方体技术可以被视为一种基于数据仓库、预计算导向的物化视图方法。它在 OLAP 或数据挖掘查询被移动以进行处理之前实现离线聚合。属性导向归纳方法 - 它…… 阅读更多

什么是凝聚层次聚类算法?

Ginni
更新于 2022年2月15日 07:01:09

1K+ 次浏览

凝聚层次聚类是一种自下而上的聚类方法,其中聚类具有子聚类,子聚类又具有子聚类,依此类推。它可以从将每个对象放在其自己的聚类中开始,然后将这些原子聚类混合成越来越高的聚类,直到所有对象都在一个单独的聚类中,或者直到它需要确定的终止条件。一些层次聚类方法用于此类型。它们仅在其对聚类间相似性的描述上有所不同。例如,一种称为 AGNES(凝聚嵌套)的方法,需要单链接技术并按如下方式操作。假设有一组对象放置在矩形中。最初,每个对象都在…… 阅读更多

关联规则的工作原理是什么?

Ginni
更新于 2022年2月15日 06:58:24

564 次浏览

关联规则学习是一种无监督学习方法,它测试一个数据元素对另一个数据元素的依赖性,并适当地创建,以便它可以更有效。它试图发现数据集变量之间的一些有趣关系或关系。它依赖于一些规则来发现数据库中变量之间的有趣关系。关联规则学习是机器学习的重要技术,它被应用于市场篮子分析、网络使用挖掘、持续生产等。在市场篮子分析中,它被一些大型零售商充分使用以发现…… 阅读更多

大型数据库中的概念描述与 OLAP 之间有什么区别?

Ginni
更新于 2022年2月15日 06:58:16

3K+ 次浏览

概念描述概念描述是一种确定类型的数据挖掘。它定义了一组数据,包括常客、研究生候选人等。它描述了数据的特征和比较。当要描述的概念被定义为一类对象时,它也被称为类描述。这些描述可以通过数据特征的支持来确定。数据特征是对目标类数据的总体特征的总结。与特定用户定义的类相关的数据通常通过数据库查询恢复。数据特征的输出可以以…… 阅读更多

什么是市场篮子分析?

Ginni
更新于 2022年2月15日 06:54:39

722 次浏览

市场篮子分析并不代表一种单独的方法,它代表了一组与理解销售点交易数据相关的业务问题。市场篮子数据是交易数据,它代表了三种从根本上不同的实体,例如用户、订单(也称为购买或篮子或在学术论文中称为项目集)和项目。订单是市场篮子数据的组成数据结构。订单描述用户的一次购买事件。这可能与用户在网站上订购多种产品相关,或者与用户购买一篮子杂货相关,或者与用户购买多种商品相关…… 阅读更多

当将数据挖掘视为知识发现过程时,涉及哪些步骤?

Ginni
更新于 2022年2月15日 06:52:52

4K+ 次浏览

KDD 代表数据库中的知识发现。它定义了在数据中发现知识的广泛过程,并强调了特定数据挖掘技术的更高级别应用。它是几个领域的研究人员感兴趣的领域,例如人工智能、机器学习、模式识别、数据库、统计学、专业系统的知识获取以及数据可视化。KDD 过程的主要目标是从大量数据库中的信息中提取数据。它通过利用数据挖掘算法来识别被认为是知识的内容来做到这一点。数据库中的知识发现被视为一个程序化、探索性分析和建模…… 阅读更多

关联规则有哪些应用?

Ginni
更新于 2022年2月15日 06:51:54

8K+ 次浏览

关联规则学习是一种无监督学习方法,它测试一个数据元素对另一个数据元素的依赖性,并适当地创建,以便它可以更有效。它试图发现数据集变量之间的一些有趣关系或关系。它依赖于一些规则来发现数据库中变量之间的有趣关系。关联规则学习是机器学习的重要技术,它被应用于市场篮子分析、网络使用挖掘、持续生产等。在市场篮子分析中,它被一些大型零售商充分使用以…… 阅读更多

数据挖掘的组成部分是什么?

Ginni
更新于 2022年2月15日 06:50:08

5K+ 次浏览

数据挖掘是选择、探索和建模大量信息的过程,以发现最初未知的规律或关系,从而为数据库所有者获得清晰和有益的结果。数据挖掘是一个跨学科领域,是一组学科的集合,例如数据库系统、统计学、机器学习、可视化和数据科学。它基于使用的数据挖掘方法,可以采用其他学科的方法,包括神经网络、模糊和粗糙集理论、知识表示、归纳逻辑编程或高性能计算。它建立在要…… 阅读更多

什么是协同过滤?

Ginni
更新于 2022年2月15日 06:48:14

501 次浏览

协同过滤是一种基于记忆的推理的不同方法,特别适合于支持个性化推荐的应用。协同过滤系统从人员偏好的历史开始。距离函数决定相似性取决于偏好的重叠,喜欢相同事物的人彼此接近。此外,投票会根据距离加权,因此较近邻居的投票在认可方面更重要。换句话说,它是一种通过使用同行群体为其相同选择的选择来发现适合特定人的音乐、书籍、葡萄酒或其他人的方法…… 阅读更多

广告