什么是KDD?
KDD 代表知识发现 (Knowledge Discovery in Databases)。它定义了从数据中发现知识的广泛过程,并强调了特定数据挖掘技术的更高级别应用。它是许多领域研究人员感兴趣的领域,例如人工智能、机器学习、模式识别、数据库、统计学、专业系统知识获取和数据可视化。
KDD 过程的主要目标是从大型数据库中的信息中提取数据。它通过利用数据挖掘算法来识别被认为是知识的内容来做到这一点。数据库中的知识发现被视为对大型数据存储库进行的程序化、探索性分析和建模。KDD 是从大型且复杂的数据集中识别有效、有用和可理解的设计的有组织的过程。
KDD 是识别数据中有效、新颖、可能有用且基本上合乎逻辑的设计的非平凡过程。该过程表明,KDD 包括许多步骤,包括数据准备、模式搜索、知识评估和细化,所有这些步骤都在多次迭代中重复。非平凡是指包含某些搜索或推理;即,它不是像计算一组数字的平均值那样对预定义量进行简单的计算。
数据挖掘是 KDD 过程的根源,例如推断出用于调查记录、开发模型和发现以前未知模式的算法。该模型用于从信息中提取知识、分析信息和预测信息。
数据挖掘是 KDD 过程中的一步,包括应用数据分析和发现算法,这些算法在可接受的计算效率限制下,对数据进行模式(或模型)的特定枚举。
模式领域通常是无限的,并且模式的枚举包含此空间中某种形式的搜索。实际的计算约束对数据挖掘算法可以分析的子空间施加了严格的限制。
KDD 过程包括使用数据库以及对其进行的一些必要的选择、预处理、子采样和转换;使用数据挖掘方法(算法)从中枚举模式;以及计算数据挖掘的产出以识别被认为是知识的枚举模式的子集。
KDD 过程中的数据挖掘组件与从记录中提取和枚举模式的算法方法有关。完整的 KDD 过程包括对挖掘出的模式进行评估和可能的解释,以确定哪些模式可以被视为新知识。
数据结构
网络
关系型数据库管理系统
操作系统
Java
iOS
HTML
CSS
Android
Python
C语言编程
C++
C#
MongoDB
MySQL
Javascript
PHP