属性选择度量是一种启发式方法,用于选择“最佳”分离给定数据分区 D(带类标签的训练元组)成单个类的分裂测试。如果它可以根据分裂标准的结果将 D 分成更小的分区,理想情况下,每个分区都可以是纯净的(即,落入给定分区的一些元组可以属于同一类)。从概念上讲,“最佳”分裂标准最接近于产生这种方法的结果。属性选择度量称为分裂规则,因为它们决定如何在给定节点处的元组被划分。属性选择... 阅读更多
频繁模式挖掘有几个标准,如下所示:- 基于要挖掘的模式的完整性 - 它可以挖掘整个频繁项集的集合、闭合频繁项集和最大频繁项集,前提是给定一个最小支持阈值。它还可以提取受约束的频繁项集(它可以满足一组用户定义的约束)、近似频繁项集(它可以仅更改挖掘的频繁项集的近似支持计数)、近似匹配频繁项集(它可以计算相对匹配项集的支持计数)、前 k 个频繁项集(即用户指定的 k 个最频繁项集)... 阅读更多