数据挖掘系统与数据库系统的集成是什么?
数据挖掘系统与数据库或数据仓库系统集成,以便其能够有效地执行任务。数据挖掘系统在一个需要与其他数据系统(如数据库系统)通信的环境中运行。以下是一些可以集成这些系统的可能的集成方案:
无耦合 - 无耦合定义为数据挖掘系统不使用数据库或数据仓库系统的任何功能。它可以从特定来源(包括文件系统)检索数据,使用一些数据挖掘算法处理数据,然后将挖掘结果保存到不同的文件中。
这样的系统虽然简单,但存在各种局限性。首先,数据库系统在存储、组织、访问和处理数据方面提供了很大的灵活性和适应性。不使用数据库/数据仓库系统,数据挖掘系统可能会花费大量时间查找、收集、清理和转换数据。
松耦合 - 在这种数据挖掘系统中,它使用数据库或数据仓库系统的一些服务。数据是从这些系统处理的数据存储库中获取的。数据挖掘方法用于处理数据,然后将处理后的数据保存到文件中或数据库或数据仓库中的指定区域。松耦合优于无耦合,因为它可以使用查询处理或各种系统设施来获取存储在数据库中的一些数据区域。
半紧耦合 - 在这种情况下,可以在数据库/数据仓库系统中支持一些基本数据挖掘原语的充分执行。这些原语可以包含排序、索引、聚合、直方图分析、多路连接以及一些重要统计度量的预计算,包括总和、计数、最大值、最小值、标准差等。
紧耦合 - 紧耦合定义为数据挖掘系统与数据库/数据仓库系统无缝集成。数据挖掘子系统被视为信息系统的一个功能元素。
数据挖掘查询和函数是在数据库/数据仓库系统的挖掘查询分析、数据结构、索引方案和查询处理方法的基础上开发和建立的。这是非常理想的,因为它支持数据挖掘功能的有效实现、高系统性能和集成的数 据处理环境。
广告