找到关于数据库的6705 篇文章

挖掘频繁项集的任务为什么困难?

Ginni
更新于 2022年2月15日 08:04:53

239 次浏览

数据挖掘是从存储在存储库中的大量记录中提取有用的新关联、模式和趋势的过程,它使用包括统计和数值技术在内的模式识别技术。它是对事实数据集的分析,以发现意想不到的关系,并以对数据库所有者既有逻辑又有帮助的新方法来总结记录。它是选择、探索和建模海量信息以发现最初未知的规律或关系的过程,从而为数据库所有者获得清晰且有益的结果。数据挖掘类似于…… 阅读更多

什么是关联规则学习?

Ginni
更新于 2022年2月15日 08:02:55

5K+ 次浏览

关联规则学习是一种无监督学习技术,它测试一个数据元素对另一个数据元素的依赖性,并进行相应的改进,使其更具成本效益。它试图发现数据集变量之间的一些有趣关系或关联。它依赖于各种规则来发现数据库中变量之间有趣的关系。关联规则学习是机器学习中最重要的途径之一,它被应用于市场篮子分析、网络使用挖掘、持续生产等。在市场篮子分析中,它是许多大型零售商使用的…… 阅读更多

为什么数据挖掘需要统计学?

Ginni
更新于 2022年2月15日 08:00:27

173 次浏览

统计学是从数据中学习的科学。它涵盖了从规划记录集和后续数据管理到最终活动的一切,包括从称为数据的数字事实中得出推论和呈现结果。统计学关注的是人类最基本的需求:在创新和不确定性面前,需要更多地了解世界以及世界如何运作。信息是知识的交流。数据本身被称为原始数据,而不是知识。从数据到知识的序列如下:从数据到信息(数据发展成信息…… 阅读更多

什么是基于模型的聚类?

Ginni
更新于 2022年2月15日 07:53:53

15K+ 次浏览

基于模型的聚类是一种统计数据聚类方法。观察到的(多元)数据被认为是由有限数量的组件模型生成的。每个组件模型是一个概率分布,通常是一个参数多元分布。例如,在多元高斯混合模型中,每个组件都是一个多元高斯分布。负责生成特定观察的组件决定了观察所属的集群。基于模型的聚类试图改进给定数据与某些数学模型之间的拟合,并且基于这样的假设:数据是由基本…… 阅读更多

什么是STING基于网格的聚类?

Ginni
更新于 2022年2月15日 07:52:13

4K+ 次浏览

基于网格的聚类方法使用多分辨率网格数据结构。它将对象区域量化成有限数量的单元格,这些单元格构成一个网格结构,所有聚类操作都在该结构上实现。该方法的优点是其快速的处理时间,通常与数据对象的数量无关,而仅取决于量化空间中每个维度上的多个单元格。基于网格的聚类使用多分辨率网格数据结构,并使用密集的网格单元格来形成集群。一些有趣的方法包括STING、wave cluster和CLIQUE。STING——一种统计…… 阅读更多

无监督学习的例子有哪些?

Ginni
更新于 2022年2月15日 07:19:54

14K+ 次浏览

无监督学习是指可以提供一组未标记的数据,需要对其进行分析并找出其中的模式。例子包括降维和聚类。机器的训练是通过一组未标记、分类或分类的数据来支持的,并且该算法需要在没有监督的情况下对该数据进行处理。无监督学习的目标是将输入记录重构为新的特征或具有相同模式的对象集。根据各种度量结果…… 阅读更多

划分算法的类型有哪些?

Ginni
更新于 2022年2月15日 07:42:32

6K+ 次浏览

划分算法主要有以下两种类型:K均值聚类 - K均值聚类是最常见的划分算法。K均值将数据集中的每个数据重新分配到新形成的集群中的一个。使用距离或相似性度量将记录或数据点分配给最近的集群。K均值聚类中使用了以下步骤:可以选择K个初始聚类中心c1、c2、c3……ck。可以将S集群中的每个实例x分配到其中心点最接近x的集群。对于每个集群,根据…… 阅读更多

大型数据库中的统计度量是什么?

Ginni
更新于 2022年2月15日 07:22:15

3K+ 次浏览

关系数据库系统支持五种内置聚合函数,例如count()、sum()、avg()、max()和min()。这些聚合函数可以用作多维信息描述性挖掘中的基本度量。有两种描述性统计度量,例如集中趋势度量和数据离散度度量,可以有效地用于高维数据库。集中趋势度量 - 集中趋势度量,例如均值、中位数、众数和中程数。均值 - 算术平均值简单地通过将所有值加在一起并除以值的数量来计算。它使用了每个值的…… 阅读更多

为什么需要分析特征描述和属性相关性分析,以及如何进行这些分析?

Ginni
更新于 2022年2月15日 07:09:36

2K+ 次浏览

这是一种用于预处理数据的统计方法,用于过滤掉不相关的属性或对相关属性进行排序。属性相关性分析的度量可用于识别可以从概念描述过程中取消授权的不相关属性。将此预处理步骤纳入类特征描述或比较的过程定义为分析特征描述。数据辨别创建辨别规则,这是一种比较目标类和对比类之间对象的一般特征的方法。它是将目标类数据对象的总体特征与对象的总体特征进行比较…… 阅读更多

如何区分不同的类别?

Ginni
更新于 2022年2月15日 07:04:13

547 次浏览

阶级歧视被定义为阶级主义。它是基于社会阶层的偏见或歧视。它涉及个人态度、行为、政策制度和做法,这些制度和做法是为了让上层阶级以牺牲下层阶级为代价而获益。阶级主义可以定义为针对下层阶级的个人偏见和制度性阶级主义,就像种族主义一词可以严格地定义为个人偏见或制度性种族主义一样。后者被描述为有意识或无意识的阶级主义如何在社会各个机构中显现。“阶级歧视可以在多种媒体形式中看到,包括电视节目、电影和…… 阅读更多

广告