找到 6705 篇文章 关于数据库

什么是 Apriori 算法?

Ginni
更新于 2022-02-16 11:26:46

1K+ 浏览量

Apriori 是一种由 R. Agrawal 和 R. Srikant 于 1994 年开发的开创性算法,用于挖掘布尔关联规则的频繁项集。该算法依赖于算法需要先前了解频繁项集属性的情况。Apriori 使用一种称为逐层搜索的迭代方法,其中 k-项集可以探索 (k+1)-项集。首先,通过浏览数据库来汇集每个项目的计数,并接收满足最小支持度的那些项目,来发现频繁 1-项集的集合。结果集表示为 L1。接下来,L1 可以找到 L2,即频繁 2-项集的集合,它可以找到 L3,依此类推,直到不再…… 阅读更多

频繁模式挖掘的标准是什么?

Ginni
更新于 2022-02-16 11:24:16

1K+ 浏览量

频繁模式挖掘有几个标准,如下所示:- 基于要挖掘的模式的完整性 - 它可以挖掘整个频繁项集集合、封闭频繁项集和最大频繁项集,前提是提供了最小支持阈值。它还可以提取受约束的频繁项集(它可以满足一组用户定义的约束)、近似频繁项集(它可以仅更改挖掘的频繁项集的近似支持计数)、近似匹配频繁项集(它可以计算相对匹配项集的支持计数)、前 k 个频繁项集(即用户指定的 k 个最频繁项集)…… 阅读更多

类比较是如何执行的?

Ginni
更新于 2022-02-16 11:22:26

953 浏览量

类区分或比较挖掘将目标类与其对比类区分开的特征。目标类和对比类应该是可比较的,前提是它们共享相同的维度和属性。例如,人、地址和元素这三个类不可比较。但过去三年的销售额是可比较的类,计算机科学候选人和物理学候选人也是如此。开发的技术可以继续用于管理多个可比较类之间的类比较。例如,为类特征定义的属性泛化过程可以更改,以便在所有比较的类之间同步实现泛化。…… 阅读更多

属性泛化的规则是什么?

Ginni
更新于 2022-02-16 11:19:06

819 浏览量

属性泛化取决于以下规则:如果原始工作关系中某个属性的唯一值集合很大,并且存在该属性的一组泛化运算符,则应选择并将其用于该属性。此规则取决于以下推理。使用泛化服务来泛化工作关系中元组或规则内的属性值将使规则涵盖更多初始数据元组,从而泛化它定义的概念。这对应于定义为攀升泛化的泛化规则…… 阅读更多

什么是 AOI?

Ginni
更新于 2022-02-16 11:17:56

6K+ 浏览量

AOI 代表属性导向归纳。属性导向归纳方法的概念描述最早于 1989 年提出,比数据立方体方法的引入早几年。数据立方体方法本质上是基于数据的物化视图,这些视图通常已在数据仓库中预先计算。一般来说,它在提交 OLAP 或数据挖掘查询以进行处理之前执行脱机聚合。换句话说,属性导向归纳方法通常是一种面向查询、基于泛化、在线数据分析方法。属性导向归纳的一般思想是首先使用数据库查询收集与任务相关的数据,然后…… 阅读更多

数据泛化和概念描述的方法有哪些?

Ginni
更新于 2022-02-16 11:16:33

727 浏览量

数据泛化通过用更高级别的概念(例如年轻、中年和老年)替换相对较低级别的值(例如属性年龄的数值)来总结数据。鉴于数据库中保存了大量数据,能够以泛化(而不是低)抽象方法以简洁和简洁的术语定义概念是有益的。它允许在多个抽象级别上泛化数据集,从而使用户能够检查数据的总体行为。例如,给定 AllElectronics 数据库,销售经理可以更愿意查看泛化…… 阅读更多

多维梯度分析中的约束类型有哪些?

Ginni
更新于 2022-02-16 11:14:48

142 浏览量

维数灾难和对可理解结果的需求对寻找立方体级问题的高效且可扩展的解决方案构成了严峻的挑战。它可以被限制,但立方体级问题的有趣版本,称为受约束的多维梯度分析。它可以减少搜索空间并得出有趣的结果。以下是一些约束类型:显著性约束 - 这表明它只能测试数据中具有特定“统计显著性”的单元格,包括包含至少定义数量的基本单元格或至少特定总销售额。在数据…… 阅读更多

异常值是如何计算的?

Ginni
更新于 2022-02-16 11:07:59

206 浏览量

有三种度量用作异常指标,以支持识别数据异常。这些度量表示单元格中的数量相对于其预期值产生的意外程度。这些度量是在所有聚合级别为每个单元格计算和关联的。它们如下所示,包括 SelfExp、InExp 和 PathExp 度量基于表格分析的数值方法。单元格值被视为异常取决于它与预期值的差异程度,其中其预期值由统计模型确定。给定单元格值与其…… 阅读更多

什么是发现驱动探索?

Ginni
更新于 2022-02-16 11:06:07

922 浏览量

发现驱动探索就是这样一种立方体探索方法。在发现驱动探索中,指示数据异常的预先计算的度量用于在所有聚合级别指导用户进行数据分析过程。将这些度量称为异常指标。直观地说,异常是指与基于统计模型的预期值显着不同的数据立方体单元格值。该模型处理所有应用于单元格的维度的度量值的变化和模式。例如,如果对商品销售数据的分析表明 12 月份的销售额与几个月相比有所增加,…… 阅读更多

业务分析师从拥有数据仓库中能获得什么?

Ginni
更新于 2022-02-16 06:55:29

208 浏览量

数据仓库是一种可以从多个来源收集和处理数据以向企业提供重要业务洞察力的方法。数据仓库是专门为支持管理决策的目的而创建的。简单来说,数据仓库定义了一个独立于组织运营数据库维护的数据库。数据仓库系统能够集成多个应用程序系统。它们通过为分析提供可靠的整合历史数据平台来提供数据处理。数据仓库通过为 OLTP 数据库提供一个在累积时卸载记录的地方,以及通过提供…… 阅读更多

广告