如何进行类比较?


类判别或比较挖掘特征,将目标类与其对比类进行分类。目标类和对比类应该是可比较的,前提是它们具有相同的维度和属性。例如,人员、地址和元素这三个类是不可比较的。但过去三年的销售额是可比较的类,计算机科学候选人与物理学候选人也是可比较的类。

开发的技术可以继续用于管理多个可比较类之间的类比较。例如,为类特征定义的属性泛化过程可以更改,以便在所有比较的类之间同步实现泛化。这使得某些类中的属性可以泛化到类似的抽象级别。

例如,假设给出了 2003 年和 2004 年 AllElectronics 的销售数据,并且可以比较这两个类。考虑在城市、省或州以及国家级别具有抽象的维度区域。每个数据类都必须泛化到类似的位置级别。

也就是说,它们都同步泛化到城市级别、省或州级别或国家级别。这比比较,例如,2003 年温哥华的销售额与 2004 年美国的销售额(即,每组销售数据泛化到多个级别)更有帮助。

用户必须可以选择覆盖包括自动的同步比较及其选择,并在选择时使用。有几个过程如下所示:

  • **数据收集** - 通过查询处理收集数据库中相关记录的集合,并相应地将其分离到目标类和一个或一组对比类中。

  • **维度相关性分析** - 如果有多个维度,则必须在这些类上实施维度相关性分析,以仅选择高度相关的维度以进行更多分析。

  • **同步泛化** - 对目标类实施泛化,使其达到用户或专业人员指定的维度阈值管理的级别,从而产生主要目标类关系。

  • **派生比较的呈现** - 生成的类比较描述可以以表格、图形和规则的形式预期。此演示通常涉及“对比”度量,包括反映目标类和对比类之间比较的 count%(百分比计数)。

用户可以通过对目标类和对比类使用钻取、上卷和不同的 OLAP 操作来调节比较描述,如获得的。

更新于: 2022年2月16日

940 次浏览

启动您的 职业生涯

通过完成课程获得认证

开始
广告