什么是时间数据挖掘?
时间数据挖掘定义了从大型时间数据集中提取非平凡的、隐含的和潜在的关键数据的过程。时间数据是一系列主要数据类型,通常是数值,它处理从时间数据中收集有益知识。
时间数据挖掘的目标是利用机器学习、统计学和数据库技术的一组方法,在由一系列被称为时间序列的名义符号组成的更高阶序数据中,找到时间模式、意外趋势或一些隐藏的关系,以及一系列连续的实值分量。
时间数据挖掘由三个主要工作组成,例如时间数据的描述、相似性度量的表示和挖掘服务。
时间数据挖掘包括处理时间序列,通常是数据序列,它计算同一属性在多个时间点的序列中的值。近年来,使用此类信息进行模式匹配(即搜索感兴趣的特定模式)引起了相当大的兴趣。
时间数据挖掘可以包括对为时间数据库开发的高效数据存储技术、快速处理和快速检索方法的利用。
时间数据挖掘是时间数据库中知识发现过程中的一个单独阶段,它从时间数据中计算时间模式或拟合模型,时间数据挖掘算法也是如此。
时间数据挖掘关注的是对时间数据的分析,以及发现时间信息集中的时间模式和一致性。它还允许计算机驱动的自动数据探索。时间挖掘中的各种任务如下:
- 数据特征描述和比较
- 聚类分析
- 分类
- 关联规则
- 模式分析
- 预测和趋势分析
时间数据挖掘导致了一种与时间数据库交互的新方法,并允许以比例如时间结构化查询语言允许的更抽象的级别指定查询。它还为由于多重性和多维性而产生的问题提供了数据探索。
时间分类的基本目标是根据其他字段预测时间数据库中时间相关的字段。一般来说,这个问题被描述为在给定不同字段的情况下确定被预测的时间变量的一般值,训练数据在其中为每个观测值给出目标变量,以及一组表示对问题的先验知识的假设。时间分类技术与密度估计的复杂问题有关。
广告