数据挖掘 - 系统



存在各种各样的数据挖掘系统。数据挖掘系统可以整合以下技术:

  • 空间数据分析
  • 信息检索
  • 模式识别
  • 图像分析
  • 信号处理
  • 计算机图形学
  • Web技术
  • 商业
  • 生物信息学

数据挖掘系统分类

数据挖掘系统可以根据以下标准进行分类:

  • 数据库技术
  • 统计学
  • 机器学习
  • 信息科学
  • 可视化
  • 其他学科
Data Mining Systems

除此之外,数据挖掘系统还可以根据(a)挖掘的数据库类型,(b)挖掘的知识类型,(c)使用的技术以及(d)应用的应用进行分类。

基于挖掘的数据库的分类

我们可以根据挖掘的数据库类型对数据挖掘系统进行分类。数据库系统可以根据不同的标准进行分类,例如数据模型、数据类型等,数据挖掘系统可以相应地进行分类。

例如,如果我们根据数据模型对数据库进行分类,那么我们可能会有关系型、事务型、对象关系型或数据仓库挖掘系统。

基于挖掘的知识类型的分类

我们可以根据挖掘的知识类型对数据挖掘系统进行分类。这意味着数据挖掘系统是基于以下功能进行分类的:

  • 特征描述
  • 区分
  • 关联和相关性分析
  • 分类
  • 预测
  • 异常值分析
  • 演变分析

基于所用技术的分类

我们可以根据使用的技术类型对数据挖掘系统进行分类。我们可以根据所涉及的用户交互程度或所采用的分析方法来描述这些技术。

基于所应用的应用程序的分类

我们可以根据所应用的应用程序对数据挖掘系统进行分类。这些应用程序如下:

  • 金融
  • 电信
  • DNA
  • 股票市场
  • 电子邮件

将数据挖掘系统与DB/DW系统集成

如果数据挖掘系统没有与数据库或数据仓库系统集成,那么将没有系统可以进行通信。这种方案被称为非耦合方案。在这种方案中,主要关注的是数据挖掘设计以及为挖掘可用数据集而开发高效有效的算法。

集成方案列表如下:

  • 无耦合 - 在此方案中,数据挖掘系统不使用任何数据库或数据仓库功能。它从特定来源获取数据,并使用一些数据挖掘算法来处理这些数据。数据挖掘结果存储在另一个文件中。

  • 松耦合 - 在此方案中,数据挖掘系统可以使用数据库和数据仓库系统的一些功能。它从这些系统管理的数据存储库中获取数据,并对这些数据执行数据挖掘。然后,它将挖掘结果存储在文件中,或存储在数据库或数据仓库中的指定位置。

  • 半紧耦合 - 在此方案中,数据挖掘系统与数据库或数据仓库系统相连,此外,可以在数据库中提供一些数据挖掘原语的高效实现。

  • 紧耦合 - 在此耦合方案中,数据挖掘系统被平滑地集成到数据库或数据仓库系统中。数据挖掘子系统被视为信息系统的一个功能组件。

广告