如何可视化数据以支持交互式决策树的构建?


基于感知的分类 (PBC) 是一种基于多维可视化方法的交互式方法,使用户能够在构建决策树时整合有关数据的背景知识。

通过以视觉方式与数据交互,用户更有可能对数据产生更深入的理解。由此产生的树可能比使用传统决策树归纳技术构建的树更小,因此更容易解释,同时也能达到类似的准确率。

PBC 需要一种像素导向的方法来考虑其类别标签数据的多维数据。采用圆形分割方法,该方法将 d 维信息对象映射到一个圆上,该圆被分成 d 个段,每个段定义一个属性。

数据元素的属性值映射到一个彩色像素,反映对象的类别标签。对每个数据对象的每个属性-值对完成此映射。对每个属性完成排序以确定段内的排列顺序。

例如,可以组织给定段内的属性值,以便在相似的属性值内显示同质(关于类别标签)区域。一次可以预期到的训练信息量大约由多个属性和多个数据对象的乘积决定。

PBC 系统显示一个分屏,包括数据交互窗口和知识交互窗口。数据交互窗口显示正在检查的数据的圆形段,而知识交互窗口显示迄今为止构建的决策树。整个训练集可视化在数据交互窗口中,而知识交互窗口显示一个空决策树。

传统的决策树算法仅允许对统计属性进行二元分割。PBC 使用户能够定义多个分割点,从而导致从单个树节点生长出多个分支。

树的构建方式如下。用户在数据交互窗口中查看多维数据并选择一个分割属性和多个分割点。知识交互窗口中的现代决策树得到扩展。

用户选择决策树的一个节点。用户可以为该节点创建类别标签(这将该节点创建为叶子)或请求可视化等效于该节点的训练信息。这将导致可视化每个属性(除了用于分割沿从根到该节点路径上的元素的属性)的新可视化。交互过程持续进行,直到为决策树的每个叶子创建了一个类别。

更新于: 2022-02-18

166 次查看

开启你的 职业生涯

通过完成课程获得认证

开始学习
广告