找到 6705 篇文章 关于数据库

数据泛化和分析泛化的例子是什么?

Ginni
更新于 2022年2月15日 07:01:54

1K+ 阅读量

数据泛化通过用高级概念(包括年轻、中年和老年)替换相对低级的值(包括属性年龄的数值)来概括数据。因此,它是一个从相对较低的概念级别到较高的概念级别的数据库中抽象大量任务相关信息的过程。以下是两种用于高效灵活地泛化大型数据集的方法:OLAP 方法 - 数据立方体技术可以被视为一种基于数据仓库、预计算导向的物化视图方法。它在移动 OLAP 或数据挖掘查询以进行处理之前实现了脱机聚合。面向属性的归纳方法 - 它 ... 阅读更多

什么是凝聚层次聚类算法?

Ginni
更新于 2022年2月15日 07:01:09

1K+ 阅读量

凝聚层次聚类是一种自底向上的聚类方法,其中聚类具有子聚类,子聚类依次具有子聚类,等等。它可以从将每个对象放在其自己的聚类中开始,然后将这些原子聚类混合成越来越高的聚类,直到所有对象都在一个单独的聚类中,或者直到它需要明确的终止条件。一些层次聚类方法用于此类型。它们仅在它们对聚类间相似性的描述上有所不同。例如,一种称为 AGNES(凝聚嵌套)的方法需要单链接技术并按如下方式操作。假设有一组对象放置在一个矩形中。最初,每个对象都在... 阅读更多

关联规则的工作原理是什么?

Ginni
更新于 2022年2月15日 06:58:24

564 阅读量

关联规则学习是一种无监督学习方法,它测试一个数据元素对另一个数据元素的依赖性并进行适当的创建,以便它可以更有效。它试图发现数据集变量之间的一些有趣关系或关系。它依赖于一些规则来发现数据库中变量之间的有趣关系。关联规则学习是机器学习的重要技术,它被应用于市场篮子分析、网络使用挖掘、持续生产等。在市场篮子分析中,它被一些大型零售商充分利用来发现... 阅读更多

大型数据库中的概念描述与 OLAP 之间有什么区别?

Ginni
更新于 2022年2月15日 06:58:16

3K+ 阅读量

概念描述概念描述是一种确定性的数据挖掘类型。它定义了一组数据,包括常客、研究生候选人等。它描述了数据的特征和比较。当要描述的概念定义为一类对象时,它也称为类描述。这些描述可以通过数据特征的支持来确定。数据特征是对目标类数据的总体特征的总结。与特定用户定义的类相关的数据通常通过数据库查询恢复。数据特征的输出可以以... 阅读更多

什么是市场篮子分析?

Ginni
更新于 2022年2月15日 06:54:39

722 阅读量

市场篮子分析并不代表一种单独的方法,它代表了一组与理解销售点交易数据相关的业务问题。市场篮子数据是交易数据,表示三种从根本上不同的实体,例如用户、订单(也称为购买或篮子或在学术论文中称为项目集)和项目。订单是市场篮子数据的组件数据结构。订单描述用户的一次购买事件。这可能与用户在网站上订购多种产品相关,或者与用户购买一篮子杂货相关,或者与用户购买多件... 阅读更多

当将数据挖掘视为知识发现过程时,涉及哪些步骤?

Ginni
更新于 2022年2月15日 06:52:52

4K+ 阅读量

KDD 代表数据库中的知识发现。它定义了在数据中发现知识的广泛过程,并强调了特定数据挖掘技术的更高层次的应用。它是许多领域研究人员感兴趣的领域,例如人工智能、机器学习、模式识别、数据库、统计学、专业系统的知识获取以及数据可视化。KDD 过程的主要目标是从大型数据库中的信息中提取数据。它通过利用数据挖掘算法来识别被认为是知识的内容来做到这一点。数据库中的知识发现被视为一种程序化、探索性分析和建模... 阅读更多

关联规则的应用有哪些?

Ginni
更新于 2022年2月15日 06:51:54

8K+ 阅读量

关联规则学习是一种无监督学习方法,它测试一个数据元素对另一个数据元素的依赖性并进行适当的创建,以便它可以更有效。它试图发现数据集变量之间的一些有趣关系或关系。它依赖于一些规则来发现数据库中变量之间的有趣关系。关联规则学习是机器学习的重要技术,它被应用于市场篮子分析、网络使用挖掘、持续生产等。在市场篮子分析中,它被一些大型零售商充分利用来... 阅读更多

数据挖掘的组成部分是什么?

Ginni
更新于 2022年2月15日 06:50:08

5K+ 阅读量

数据挖掘是从大量信息中选择、探索和建模的过程,以发现最初未知的规律或关系,以便为数据库所有者获得清晰和有益的结果。数据挖掘是一个跨学科领域,是一组学科的集合,例如数据库系统、统计学、机器学习、可视化和数据科学。它基于使用的数据挖掘方法,可以使用来自其他学科的方法,包括神经网络、模糊和粗糙集理论、知识表示、归纳逻辑编程或高性能计算。它建立在数据类型上... 阅读更多

什么是协同过滤?

Ginni
更新于 2022年2月15日 06:48:14

501 阅读量

协同过滤是基于记忆的推理的一种差异,特别适合于支持个性化推荐的应用。协同过滤系统从个人偏好的历史开始。距离函数决定相似性取决于偏好的重叠,喜欢相同事物的人彼此靠近。此外,投票会根据距离加权,因此较近邻居的投票对认可的影响更大。换句话说,它是一种通过使用同行组的选择来发现适合特定人当前偏好的音乐、书籍、葡萄酒或其他事物的方法,以满足他们的相同... 阅读更多

数据挖掘在商业领域有什么用?

Ginni
更新于 2022年2月15日 06:47:36

224 阅读量

数据挖掘,也称为数据知识发现,是一种识别数百万数据(尤其是结构化数据)之间任何异常、相关性、趋势或模式的技术,以获取对业务决策有用的见解,而这些见解在传统分析中可能被忽略。数据挖掘的目的是利用复杂的数值算法找到以前被忽略或未知的事实或数据。数据挖掘类似于数据科学。它由一个人在特定情况下,针对特定数据集,以特定目标进行。此阶段包含几种类型的服务……阅读更多

广告