元规则在数据挖掘中如何发挥作用?


数据挖掘是从存储在存储库中的大量数据中提取有用的新关联、模式和趋势的过程,它使用模式识别技术,包括统计和数学技术。它是对事实数据集的分析,以发现意想不到的关系,并以对数据库所有者既逻辑又有效的新方法总结记录。

它是选择、探索和建模海量信息以发现最初未知的规律或关系的过程,从而为数据库所有者获得清晰而有益的结果。

数据挖掘类似于数据科学。它由一个人在特定情况下、针对特定数据集、以特定目标进行。此阶段包含多种类型的服务,包括文本挖掘、网络挖掘、音频和视频挖掘、图像数据挖掘和社交媒体挖掘。它是通过简单或高度特定的软件完成的。

元规则使用户能够定义他们参与挖掘的规则的语法形式。规则形式可以用作约束,以提高挖掘阶段的有效性。元规则可以基于分析师对数据或自动生成的经验、期望或直觉,具体取决于数据库模式。

**元规则引导的挖掘** - 考虑一下作为 AllElectronics 的市场分析师,它可以访问定义客户(包括客户年龄、地址和信用评级)的数据以及客户交易列表。

它可以查找客户特征与客户购买的商品之间的关联。但是,它不仅要查找反映这些关系的一些关联规则,而且只对确定哪些客户特征对销售办公软件有帮助感兴趣。

此类元规则的一个示例是

P1(X, Y)∧ P2(X, W) ⇒ buys(X, “office software”)

其中 P1 和 P2 是谓词变量,在挖掘阶段被实例化为给定数据库中的属性,X 是定义客户的变量,Y 和 W 分别取分配给 P1 和 P2 的属性的值。

通常,用户可以定义要用于与 P1 和 P2 实例化的属性列表。因此,可以使用默认集。

一般来说,元规则形成了关于用户参与感知或确认的关系的假设。数据挖掘系统可以搜索连接给定元规则的规则。例如,

age(X, “30...39”)∧income(X, “41K...60K”) ⇒ buys(X, “office software”)

更新于: 2022年2月16日

695 次浏览

开启你的 职业生涯

通过完成课程获得认证

开始学习
广告