找到 6705 篇文章 关于数据库

属性子集选择的常用方法是什么?

Ginni
更新于 2021年11月19日 12:10:26

3K+ 浏览量

属性子集选择通过消除不相关或冗余的属性(或维度)来减少数据集的大小。属性子集选择的目的是发现最小的属性集,使得所得数据的类别概率分布尽可能接近使用所有属性访问的原始分布。在减少的属性集上进行数据挖掘具有额外的优势。它减少了发现的模式中出现的多个属性,有助于使模式更容易理解。对于 n 个属性,有 2n 个可能的子集。对属性的最佳子集进行穷举搜索可能非常昂贵,... 阅读更多

什么是数据规约?

Ginni
更新于 2021年11月19日 12:03:55

4K+ 浏览量

数据挖掘应用于大型数据库中选定的数据。当对大量数据进行数据分析和挖掘时,处理过程需要很长时间,这使其变得不切实际且不可行。为了减少数据分析的处理时间,可以使用数据规约技术来获得数据集的缩减表示,该表示在体积上要小得多,同时保持原始数据的完整性。通过减少数据,可以提高数据挖掘过程的效率,从而产生相同的分析结果。数据规约旨在定义 ... 阅读更多

什么是数据转换?

Ginni
更新于 2021年11月19日 12:02:33

1K+ 浏览量

在数据转换中,数据被转换或组合成适合挖掘的形式。数据转换可能涉及以下内容:平滑 - 它可以用于去除数据中的噪声。此类方法包括分箱、回归和聚类。聚合 - 在聚合中,将汇总或聚合操作应用于数据。例如,可以聚合每日销售数据以计算每月和每年的总金额。此阶段通常用于创建用于在多个粒度级别分析数据的数据立方体。泛化 - 在泛化中,将低级或“原始”(原始)数据恢复为更高级别的概念 ... 阅读更多

什么是数据集成?

Ginni
更新于 2021年11月19日 11:58:32

4K+ 浏览量

数据集成是从多个不同来源组合数据的阶段。在实施数据集成时,它应该处理数据冗余、不一致、重复等问题。在数据挖掘中,数据集成是一种数据预处理技术,包括将来自多个异构数据源的数据合并成连贯的数据,以保留和支持信息的综合视角。它将来自各种来源的数据组合到一个连贯的数据存储中,包括数据仓库。这些来源可能包括多个数据库、数据立方体或平面文件等。在数据集成期间,需要考虑多个问题。模式集成和对象匹配可能很复杂。因为 ... 阅读更多

什么是数据清洗?

Ginni
更新于 2021年11月19日 11:55:23

15K+ 浏览量

数据清洗定义为通过填充缺失值、平滑噪声数据、分析和去除异常值以及消除数据中不一致性来清理数据。有时,多个详细级别的数据可能与所需的不同,例如,它可能需要 20-30、30-40、40-50 的年龄范围,而导入的数据包含出生日期。可以通过将数据拆分为适当的类型来清理数据。数据清洗的类型数据清洗有多种类型,如下所示:缺失值 - 缺失值用适当的值填充。有以下方法 ... 阅读更多

数据挖掘背后的动机是什么?

Ginni
更新于 2021年11月19日 11:54:12

5K+ 浏览量

数据挖掘是通过共享存储在存储库中的大量数据来查找有用的新关联、模式和趋势的过程,使用包括统计和数学技术的模式识别技术。它是对事实数据集的分析,以发现意想不到的关系,并以对数据所有者既有逻辑又有帮助的新方法汇总记录。它是选择、探索和建模大量信息以查找最初未知的规律或关系的过程,以便为数据库所有者获得清晰且有益的结果。它不仅限于 ... 阅读更多

数据挖掘系统与数据库系统的集成是什么?

Ginni
更新于 2021年11月19日 11:51:05

8K+ 浏览量

数据挖掘系统与数据库或数据仓库系统集成,以便它能够在有效的环境中执行其任务。数据挖掘系统在需要与其他数据系统(如数据库系统)通信的环境中运行。有几种可能的集成方案可以集成这些系统,如下所示:无耦合 - 无耦合定义数据挖掘系统将不使用数据库或数据仓库系统的任何功能。它可以从特定来源(包括文件系统)检索数据,使用一些数据处理数据 ... 阅读更多

数据挖掘的功能是什么?

Ginni
更新于 2023年10月31日 14:21:09

63K+ 浏览量

数据挖掘功能用于表示必须在数据挖掘任务中发现的模式类型。一般来说,数据挖掘任务可以分为两类,包括描述性和预测性。描述性挖掘任务定义了数据库中数据的一般特征,而预测性挖掘任务则对当前信息进行推理以发展预测。数据挖掘功能有很多,如下所示:数据特征 - 它是对数据类对象的一般特征的总结。对应于用户指定类的数据通常由 ... 阅读更多

可以挖掘哪些类型的数据?

Ginni
更新于 2021年11月19日 11:37:18

15K+ 浏览量

数据挖掘定义为从海量数据中提取或挖掘知识。数据挖掘通常用于保存和处理大量数据的地方。例如,银行系统使用数据挖掘来保存大量数据,这些数据不断被处理。在数据挖掘中,根据多个类别将数据隐藏模式考虑成有用的数据片段。这些数据汇集在一个区域(包括数据仓库)中进行分析,并执行数据挖掘算法。这些数据有助于做出有效的决策,从而降低价值并增加收入。有各种 ... 阅读更多

比特率和波特率的区别

Kiran Kumar Panigrahi
更新于 2022年11月24日 12:43:49

9K+ 浏览量

在电信和电子工程中,比特率和波特率是数据通信领域中常用的两个术语。这两个术语都表示计算机网络中数据传输的速度。比特率和波特率之间的基本区别在于,比特率定义为单位时间内通过网络传输的比特数(二进制 0 和 1),而波特率定义为单位时间内通过网络传输的信号单元数。因此,比特率和波特率都是相关的术语,它们之间的关系 ... 阅读更多

广告