标称数据概念层次结构的生成方法有哪些?


标称数据概念层次结构的生成方法多种多样,如下所示:

由用户或专业人员在模式级别显式指定属性的部分排序 - 标称属性或维度的概念层次结构通常包含一组属性。用户或专业人员可以通过在模式级别定义属性的部分或总控制来简单地表示概念层次结构。

例如,假设一个关系数据库包含以下属性集,如街道、城市、省或州和国家/地区。数据仓库位置维度可以包含相同的属性。可以通过在模式级别描述这些属性之间的总排序来表示层次结构,包括街道 < 城市 < 省或州 < 国家/地区。

通过显式数据分组指定部分层次结构 - 这基本上是概念层次结构一部分的手动描述。在一个庞大的数据库中,通过显式值枚举来描述整个概念层次结构是不现实的。

指定一组属性,但不指定其部分排序 - 用户可以定义一组形成概念层次结构的属性,但排除显式声明其部分排序。系统可以尝试自动创建属性排序,以便建立一个有意义的概念层次结构。

考虑到以下观察结果:因为较高层次的概念通常涵盖多个从属的较低层次的概念,所以描述高概念级别的属性(例如,国家/地区)通常包含比描述较低概念级别的属性(例如,街道)更少的不同值。

它依赖于此观察结果,可以根据给定属性集中每个属性的多个不同值自动创建概念层次结构。具有最多不同值的属性位于最低层次结构级别。

属性的不同值越少,它在生成的层次结构中就越大。此启发式规则在几种情况下运行良好。在分析生成的层次结构后,用户或专家可以在必要时使用一些本地级交换或调整。

仅指定部分属性集 - 有时,用户在描述层次结构时可能不准确,或者对层次结构中必须包含的内容只有模糊的概念。因此,用户可以在层次结构描述中仅包含相关属性的一个小子集。

它可以管理此类部分指定的层次结构,必须将信息语义嵌入到数据库设计中,以便可以将具有快速语义链接的属性固定在一起。在这种方法中,一个属性的表示可以触发一整组语义紧密连接的属性被“拖入”以设计一个完整的层次结构。用户应根据需要选择反转此功能。

更新于: 2022年2月18日

1K+ 浏览量

开启你的 职业生涯

通过完成课程获得认证

开始学习
广告

© . All rights reserved.