多维梯度分析中的约束类型有哪些?


维度灾难和对可理解结果的需求对找到立方体梯度问题的有效且可扩展的解决方案提出了严峻挑战。它可以被限制为立方体梯度问题的一个有趣版本,称为约束多维梯度分析。它可以减少搜索空间并得出有趣的结果。

以下列出了几种约束类型:

  • 显著性约束 - 这使得它可以仅测试数据中具有特定“统计显著性”的单元格,包括包含至少定义数量的基本单元格或至少特定总销售额。在数据立方体上下文中,此约束有助于作为冰山条件,从解释集中修剪大量琐碎的单元格。

  • 探测约束 - 从一些可能的单元格中选择一个单元格子集(称为探测单元格)作为检查的起点。因为立方体梯度问题需要将立方体中的每个单元格与多个单元格进行比较,这些单元格例如是给定单元格的专门化、泛化或变异,它派生出一组与数据立方体中度量值的显著变化相关的相同单元格特征。

  • 给定三个单元格 a、b 和 c,如果 a 是 b 的描述,则可以说它是 b 的后代,在这种方法中,b 是 a 的泛化或祖先。如果两个单元格在除一个维度之外的所有维度中都具有相同的值,则单元格 c 是 a 的变异,其中它们变化的维度不能具有“*”的值。

    单元格 a 和 c 被视为兄弟姐妹。即使只处理冰山立方体,也可以生成多个对。探测约束使用户能够定义一组对分析服务感兴趣的单元格。在这种方法中,研究仅针对这些单元格及其与等效祖先、后代和兄弟姐妹的关系。

  • 梯度约束 - 这指定了用户对梯度(度量变化)的兴趣范围。用户通常只对比较下的单元格(扇区)之间特定方法的变化感兴趣。

例如,它可能仅对平均利润比探测单元格的平均利润增加超过 40% 的那些单元格感兴趣。此类变化可以定义为比较下的单元格的特定度量值之间比率或差异结构中的阈值。从探测单元格获取变化的单元格定义为梯度单元格。

更新于: 2022年2月16日

142 次查看

开启您的 职业生涯

通过完成课程获得认证

开始学习
广告