什么是视觉和音频数据挖掘?
视觉数据挖掘利用数据和知识可视化方法,从海量数据集中发现隐含的和有益的知识。人类视觉系统由眼睛和大脑控制,大脑可以被认为是一个动态的、大部分并行的处理和推理引擎,包含一个巨大的知识库。
视觉数据挖掘可以被认为是数据可视化和数据挖掘这两个学科的统一。它还可以与计算机图形学、多媒体系统、人机交互、模式识别和高性能计算相关联。
一般来说,数据可视化和数据挖掘可以以以下方式集成:
数据可视化 - 数据库或数据仓库中的数据可以从多个粒度或抽象级别进行考虑,或者作为属性或维度的几种组合。数据可以以多种视觉形式显示,包括箱线图、3D 立方体、数据分布图、曲线、曲面、链接图等。
数据挖掘结果可视化 - 数据挖掘结果的可视化是将从数据挖掘中获得的结果或知识以视觉形式呈现。这些形式可能包括散点图和箱线图(来自描述性数据挖掘),以及决策树、关联规则、聚类、异常值、广义规则等。
数据挖掘过程可视化 - 此类可视化以视觉形式呈现数据挖掘的多个过程,以便用户可以查看数据的导出方式、从哪个数据库或数据仓库中提取数据,以及如何对选定的数据进行清理、集成、预处理和挖掘。此外,它还可以显示选择哪种数据挖掘方法,结果保存在哪里,以及如何考虑结果。
交互式视觉数据挖掘 - 在交互式视觉数据挖掘中,可视化工具可用于数据挖掘过程,以帮助用户做出智能的数据挖掘决策。例如,可以使用彩色扇区(其中整个空间由一个圆定义)来显示一组属性中的数据分布。此显示有助于用户确定必须首先选择哪个扇区进行分类,以及该扇区的最佳分割点在哪里。
音频数据挖掘需要音频信号来表示数据模式或数据挖掘结果的特征。尽管视觉数据挖掘可以使用图形显示来揭示有趣的模式,但它需要用户专注于观察模式并识别其中的有趣或新颖特征。
如果模式可以转换为声音和音乐,而不是观看图片,则可以聆听音高、节奏、音调和旋律来识别任何有趣或不寻常的东西。这可以减轻视觉集中的各种负担,并且比视觉挖掘更舒适。因此,音频数据挖掘是视觉挖掘的一个有趣的对应物。