在线分析挖掘的结构是什么?
OLAM 服务器在数据立方体中执行分析挖掘,类似于 OLAP 服务器执行联机分析处理。一个集成的 OLAM 和 OLAP 机制,其中 OLAM 和 OLAP 服务器都通过图形用户界面 API 接受用户联机查询(或命令),并通过立方体 API 在数据分析中操作数据立方体。
元数据目录可用于指示数据立方体的访问。数据立方体可以通过 MDDB API 访问和集成多个数据库以及通过可以提供 OLE DB 或 ODBC 连接的数据库 API 过滤数据仓库来创建。
因为 OLAM 服务器可以实现多个数据挖掘任务,包括概念描述、关联、分类、预测、聚类、时间序列分析等。它通常包括多个集成的数据挖掘模块,并且比 OLAP 服务器更复杂。
OLAM 引擎可以执行多个数据挖掘任务,例如概念描述、关联、分类、预测、聚类和时间序列分析。因此,它通常由多个集成的数据挖掘模块组成,使其比 OLAP 引擎更复杂。OLAP 和 OLAM 所需的数据立方体之间没有根本区别,尽管 OLAM 分析可能需要更强大的数据立方体构建和访问工具。
当 OLAM 涉及更多具有更细粒度的维度或涉及对数据立方体上的多特征聚合的发现驱动探索时,情况就是这样,从而需要比 OLAP 分析更多的维度。此外,当探索性数据挖掘识别出有趣的点时,OLAM 引擎可能需要从数据立方体深入到相应的关系数据库中,以对数据的特定部分进行详细分析。
当 OLAM 涉及更多具有更细粒度的维度或涉及对数据立方体上的多特征聚合的发现驱动探索时,情况就是这样,从而需要比 OLAP 分析更多的维度。此外,当探索性数据挖掘识别出有趣的点时,OLAM 引擎可能需要从数据立方体深入到相应的关系数据库中,以对数据的特定部分进行详细分析。
此外,数据挖掘过程可能会揭示构建的立方体的维度或度量不适合数据分析。在这里,改进的数据立方体设计可以提高数据仓库构建的质量。
有效的数据挖掘需要探索性数据分析。用户通常希望遍历数据库,选择相关数据的某些部分,以不同的粒度对其进行分析,并以不同的形式呈现知识/结果。
在线分析挖掘提供了对数据不同子集和不同抽象级别的数据挖掘功能。它可以通过对数据立方体和中间数据挖掘结果进行钻取、透视、过滤、切块和切片来实现这一点。这与数据/知识可视化工具一起,可以极大地提高探索性数据挖掘的能力和适应性。