找到 1861 篇文章 关于数据结构

什么是关联规则学习?

Ginni
更新于 2022年2月15日 08:02:55

5K+ 次浏览

关联规则学习是一种无监督学习技术,它测试一个数据元素对另一个数据元素的依赖性,并进行相应的设计,使其更具成本效益。它试图发现数据集变量之间的一些有趣的关联或关系。它依赖于各种规则来查找数据库中变量之间的有趣关系。关联规则学习是机器学习中最重要的方法之一,它被应用于市场篮子分析、网页使用挖掘、持续生产等。在市场篮子分析中,它是许多大型零售商使用的一种方法... 阅读更多

为什么数据挖掘需要统计学?

Ginni
更新于 2022年2月15日 08:00:27

173 次浏览

统计学是从数据中学习的科学。它涵盖从计划记录集和后续数据管理到最终活动的所有内容,包括从称为数据的数值事实中推断和呈现结果。统计学关注人们最基本的需求:在创新和不确定性面前,需要更多地了解世界以及世界如何运作。信息是知识的传递。数据本身被称为原始数据,而不是知识。从数据到知识的顺序如下:从数据到信息(数据发展成信息... 阅读更多

什么是基于模型的聚类?

Ginni
更新于 2022年2月15日 07:53:53

15K+ 次浏览

基于模型的聚类是一种统计数据聚类方法。观察到的(多元)数据被认为是由有限数量的组件模型生成的。每个组件模型都是一个概率分布,通常是参数多元分布。例如,在多元高斯混合模型中,每个组件都是一个多元高斯分布。负责生成特定观察的组件决定了观察所属的聚类。基于模型的聚类是尝试提高给定数据与某些数学模型之间的拟合度,并且基于这样的假设,即数据是由基本... 阅读更多

什么是 STING 基于网格的聚类?

Ginni
更新于 2022年2月15日 07:52:13

4K+ 次浏览

基于网格的聚类方法使用多分辨率网格数据结构。它将对象区域量化为有限数量的单元格,这些单元格形成一个网格结构,在该结构上实现所有聚类操作。该方法的优点是其快速的处理时间,通常独立于数据对象的数量,而仅取决于量化空间中每个维度中的多个单元格。基于网格的聚类使用多分辨率网格数据结构,并使用密集网格单元格形成聚类。有一些有趣的方法是 STING、波浪聚类和 CLIQUE。STING - 统计... 阅读更多

无监督学习的例子有哪些?

Ginni
更新于 2022年2月15日 07:19:54

14K+ 次浏览

无监督学习是指当它可以提供一组未标记的数据时,需要分析这些数据并在其中找到模式。示例包括降维和聚类。训练通过一组未标记、分类或分类的数据来支持机器,并且算法需要在没有监督的情况下对该数据进行操作。无监督学习的目标是将输入记录重构为新特征或一组具有相同模式的对象。聚类分析用于根据各种测量的... 阅读更多

分区算法的类型有哪些?

Ginni
更新于 2022年2月15日 07:42:32

6K+ 次浏览

分区算法主要有以下两种类型:K均值聚类 - K均值聚类是最常见的划分算法。K均值将数据集中的每个数据重新分配到形成的新聚类中的一个。使用距离或相似性度量将记录或数据点分配到最近的聚类。K均值聚类使用以下步骤:可以选择 K 个初始聚类质心 c1、c2、c3 ... ck。可以将 S 中的每个实例 x 分配到其质心最接近 x 的聚类。对于每个聚类,根据... 阅读更多

大型数据库中的统计度量有哪些?

Ginni
更新于 2022年2月15日 07:22:15

3K+ 次浏览

关系数据库系统支持五种内置聚合函数,例如 count()、sum()、avg()、max() 和 min()。这些聚合函数可以用作多维信息描述性挖掘中的基本度量。有两种描述性统计度量,例如集中趋势度量和数据离散度度量,可以有效地用于高多维数据库中。集中趋势度量 - 集中趋势度量,例如平均值、中位数、众数和中程。平均值 - 算术平均值通过将所有值加在一起并除以值的个数来简单地计算。它使用每个值的数据。让... 阅读更多

为什么需要分析特征描述和属性相关性分析,以及如何执行这些分析?

Ginni
更新于 2022年2月15日 07:09:36

2K+ 次浏览

这是一种用于预处理数据的统计方法,用于过滤掉不相关的属性或对相关属性进行排序。属性相关性分析的度量可用于识别可以从概念描述过程中排除的不相关属性。将此预处理步骤纳入类特征描述或比较的过程称为分析特征描述。数据区分创建区分规则,即比较目标类和对比类这两个类之间对象的通用特征。它是将目标类数据对象的通用特征与对象的通用特征进行比较... 阅读更多

如何区分不同的类?

Ginni
更新于 2022年2月15日 07:04:13

547 次浏览

类歧视被定义为阶级主义。它是基于社会阶层的偏见或歧视。它涉及个人态度、行为、政策体系和实践,这些体系和实践是为了让上层阶级受益,而下层阶级则付出代价。阶级主义可以定义为针对下层阶级的个人偏见和制度性阶级主义,就像种族主义一词可以严格地定义为个人偏见或制度性种族主义一样。后者已被描述为“我们社会的一些机构中,有意识或无意识的阶级主义是如何显而易见的”。阶级歧视可以在多种媒体形式中看到,包括电视节目、电影和... 阅读更多

数据泛化和分析泛化的例子是什么?

Ginni
更新于 2022年2月15日 07:01:54

1K+ 次浏览

数据泛化通过用高级概念(包括年轻、中年和老年)替换相对低级的值(包括属性年龄的数值)来概括数据。因此,它是一个将数据库中大量与任务相关的信息从相对较低的概念级别抽象到更高概念级别的过程。以下是两种用于高效灵活地泛化大型数据集的方法:OLAP方法 - 数据立方体技术可以被视为一种基于数据仓库、面向预计算的物化视图方法。它在OLAP或数据挖掘查询被移动以进行处理之前执行离线聚合。面向属性的归纳方法 - 它 ... 阅读更多

广告