找到关于数据库的6705 篇文章

数据泛化和分析泛化的例子是什么?

Ginni
更新于 2022年2月15日 07:01:54

1K+ 浏览量

数据泛化通过用高级概念(包括年轻、中年和老年)替换相对低级的数值(包括属性年龄的数值)来总结数据。因此,它是一个将数据库中大量与任务相关的信 息从相对较低的概念级别抽象到较高概念级别的过程。以下是两种高效灵活地泛化大型数据集的方法:OLAP 方法 - 数据立方体技术可以被视为一种基于数据仓库、面向预计算的物化视图方法。它在 OLAP 或数据挖掘查询被移交进行处理之前执行离线聚合。面向属性的归纳方法 - 它……阅读更多

什么是凝聚聚类算法?

Ginni
更新于 2022年2月15日 07:01:09

1K+ 浏览量

凝聚聚类是一种自下而上的聚类方法,其中簇具有子簇,子簇又具有子簇,等等。它可以从将每个对象放在其自己的簇中开始,然后将这些原子簇混合成越来越高的簇,直到所有对象都在一个单独的簇中,或者直到满足特定的终止条件。一些层次聚类方法使用这种方式。它们只在簇间相似性的描述上有所不同。例如,一种称为 AGNES(凝聚嵌套)的方法使用单链接技术,其工作原理如下。假设有一组放置在矩形中的对象。最初,每个对象都在自己的簇中……阅读更多

关联规则的工作原理是什么?

Ginni
更新于 2022年2月15日 06:58:24

564 浏览量

关联规则学习是一种无监督学习方法,它测试一个数据元素对另一个数据元素的依赖性,并进行适当的创建以使其更有效。它试图发现数据集变量之间的一些有趣关系或联系。它依赖于几个规则来发现数据库中变量之间的有趣关系。关联规则学习是机器学习中一项重要的技术,它被用于市场篮分析、Web 使用挖掘、连续生产等。在市场篮分析中,它被许多大型零售商广泛用于……阅读更多

大型数据库中的概念描述和 OLAP 之间有什么区别?

Ginni
更新于 2022年2月15日 06:58:16

3K+ 浏览量

概念描述概念描述是一种确定性的数据挖掘类型。它定义了一组数据,包括常客、毕业生候选人等。它描述了数据的特征和比较。当要描述的概念定义为一类对象时,它也被称为类描述。这些描述可以借助数据特征化来确定。数据特征化是对目标数据类的一般特征的总结。与特定用户定义的类相关的数据通常通过数据库查询来检索。数据特征化的输出可以以……阅读更多

什么是市场篮分析?

Ginni
更新于 2022年2月15日 06:54:39

722 浏览量

市场篮分析并不代表一种单独的方法,它代表一组与理解销售点交易数据相关的业务问题。市场篮数据是交易数据,它代表三种根本不同的实体:用户、订单(也称为购买或篮子,或在学术论文中称为项目集)和项目。订单是市场篮数据的组成数据结构。订单描述用户的一次购买事件。这可以与用户在一个网站上订购多种产品相关联,或者与用户购买一篮子杂货相关联,或者与用户购买多种商品相关联……阅读更多

当将数据挖掘视为知识发现过程时,涉及哪些步骤?

Ginni
更新于 2022年2月15日 06:52:52

4K+ 浏览量

KDD 代表数据库中的知识发现。它定义了从数据中发现知识的广泛过程,并强调了特定数据挖掘技术的应用。它是人工智能、机器学习、模式识别、数据库、统计学、专业系统知识获取和数据可视化等多个领域研究人员感兴趣的领域。KDD 过程的主要目标是从大型数据库中的信息中提取数据。它通过利用数据挖掘算法来识别被认为是知识的内容来实现这一点。数据库中的知识发现被视为一种程序化的、探索性的分析和建模……阅读更多

关联规则的应用有哪些?

Ginni
更新于 2022年2月15日 06:51:54

8K+ 浏览量

关联规则学习是一种无监督学习方法,它测试一个数据元素对另一个数据元素的依赖性,并进行适当的创建以使其更有效。它试图发现数据集变量之间的一些有趣关系或联系。它依赖于几个规则来发现数据库中变量之间的有趣关系。关联规则学习是机器学习中一项重要的技术,它被用于市场篮分析、Web 使用挖掘、连续生产等。在市场篮分析中,它被许多大型零售商广泛用于……阅读更多

数据挖掘的组成部分是什么?

Ginni
更新于 2022年2月15日 06:50:08

5K+ 浏览量

数据挖掘是选择、探索和建模大量信息以查找最初未知的规律或关系的过程,以便为数据库所有者获得清晰且有益的结果。数据挖掘是一个跨学科领域,它汇集了一组学科,例如数据库系统、统计学、机器学习、可视化和数据科学。它基于使用的数据挖掘方法,可以采用来自其他学科的方法,包括神经网络、模糊和粗糙集理论、知识表示、归纳逻辑编程或高性能计算。它取决于要处理的数据类型……阅读更多

什么是协同过滤?

Ginni
更新于 2022年2月15日 06:48:14

501 浏览量

协同过滤是基于记忆的推理的一种变体,特别适合于支持个性化推荐的应用。协同过滤系统从个人偏好历史开始。距离函数决定相似性取决于偏好的重叠,喜欢相同事物的人彼此接近。此外,投票根据距离加权,因此较近邻居的投票对推荐的影响更大。换句话说,这是一种通过使用同行群体为相同……的选择来发现适合特定人当前偏好的音乐、书籍、葡萄酒或其他事物的方法。阅读更多

数据挖掘在商业领域的用途是什么?

Ginni
更新于 2022年2月15日 06:47:36

224 浏览量

数据挖掘也称为数据中的知识发现,是一种识别数百万数据(尤其是结构化数据)之间的任何异常、相关性、趋势或模式的技术,以获取可用于商业决策的见解,而这些见解在传统分析中可能被忽略。数据挖掘的目标是使用复杂的数值算法查找以前被忽略或未知的事实或数据。数据挖掘类似于数据科学。它由一个人在特定情况下对特定数据集进行,并带有目标。此阶段包含几种类型的服务……阅读更多

广告