数据挖掘模型有哪些类型?
数据挖掘是从存储在存储库中的海量数据中提取有用的新关联、模式和趋势的过程,它使用包括统计和数学技术在内的模式识别技术。它是对事实数据集的分析,以发现意想不到的关系,并以对数据所有者而言既合乎逻辑又有帮助的新颖方式总结记录。
数据挖掘技术可用于为三种类型的任务创建三种类型的模型,例如描述性分析、定向分析和预测。
描述性分析 - 描述性模型定义了记录中的内容。输出是多个图表、数字或图形,用于定义正在发生的情况。假设检验构成描述性模型。换句话说,定向分析和预测在构建模型时都有一个目标。
在分析模型中,重点与输入来自相同的时间范围。在预测模型中,重点来自下一个时间范围。预测定义了发现来自一个时期的数据中的模式,这些模式能够定义下一个时期的结果。强调分析和预测之间区别的原因在于它与建模方法有关,特别是模型集形成中时间的分析。
定向分析 - 分析是许多问题的常用方法。它不需要任何复杂的数据分析。例如,调查是构建客户档案的一种常用方法。调查揭示了客户和潜在客户的样子,或者至少是调查受访者回答问题的方式。
档案通常基于人口统计变量,例如地理位置、性别和年龄。由于广告是根据这些相同的变量销售的,因此人口统计档案可以直接转化为媒体策略。
预测 - 分析使用过去的数据来描述过去发生了什么。预测更进一步。预测使用过去的数据来预测未来可能发生的事情。这是信息的一种动态用法。
虽然低储蓄余额和CD所有权之间的相关性在CD持有者的画像中可能没有好处,但高储蓄余额(与其他指标相结合)很可能成为未来CD购买的预测指标。
构建预测模型需要在模型输入或预测变量与模型输出(要预测的事物)之间进行时间上的分离。如果不支持此分区,则模型将无法运行。
广告