数据挖掘的功能是什么?
数据挖掘功能用于表示必须在数据挖掘任务中发现的模式类型。一般来说,数据挖掘任务可以分为两类,包括描述性和预测性。描述性挖掘任务定义数据库中数据的共同特征,而预测性挖掘任务则对当前信息进行推断以开发预测。
有各种数据挖掘功能,如下所示:
数据特征描述 - 它总结了数据对象类的一般特征。与用户指定类相对应的数据通常由数据库查询收集。数据特征描述的输出可以以多种形式呈现。
数据区分 - 它比较目标类数据对象的一般特征与来自一个或一组对比类的对象的一般特征。目标类和对比类可以由用户表示,并且可以通过数据库查询获取等效数据对象。
关联分析 - 它分析通常在事务数据集中一起出现的项目集。有两个参数用于确定关联规则:
它提供了识别数据库中共同项目集的方法。
置信度是在另一个项目出现时,项目出现在事务中的条件概率。
分类 - 分类是发现表示和区分数据类或概念的模型的过程,目的是能够使用该模型来预测类标签未知的对象的类。派生模型是基于对一组训练数据(即类标签已知的对象数据)的分析建立的。
预测 - 它定义了预测一些不可用的数据值或未来的趋势。可以根据对象的属性值和类的属性值来预测对象。它可以是缺失数值的预测或与时间相关的信息的增长/下降趋势。
聚类 - 它类似于分类,但类未预定义。类由数据属性表示。它是无监督学习。对象被聚类或分组,取决于最大化类内相似性和最小化类间相似性的原则。
异常值分析 - 异常值是无法在给定类或聚类中分组的数据元素。这些是与其他数据对象的一般行为具有多种行为的数据对象。此类型数据的分析对于挖掘知识可能至关重要。
演变分析 - 它定义了行为随时间变化的对象的趋势。
广告