什么是数据挖掘指标?
数据挖掘是人工智能的一种形式,它使用感知模型、分析模型和多种算法来模拟人脑的技术。数据挖掘支持机器做出人类的决策并创造人类的选择。
数据挖掘工具的用户必须指导机器规则、偏好甚至经验才能获得决策支持数据挖掘指标如下:
实用性 - 实用性涉及多个指标,这些指标告诉我们模型是否提供有用的数据。例如,将储蓄地点与销售额关联起来的数据挖掘模型既准确又可靠,但可能并非有用,因为它无法通过在相同位置插入更多商店来推广该结果。
此外,它没有回答特定位置销售额更高的根本业务问题。它还可以发现看似成功的模型毫无意义,因为它依赖于数据中的交叉关联。
投资回报率 (ROI) - 数据挖掘工具将发现隐藏在数据中的有趣模式并开发预测模型。这些模型将有几个衡量指标来表示它们与记录的匹配程度。目前尚不清楚如何根据数据挖掘分析的要素报告的一些指标来做出决策。
在数据挖掘期间访问财务信息 - 以财务术语构建决策的最简单方法是增加通常挖掘的原始信息,使其也包含财务数据。一些组织正在投资和开发数据仓库和数据市场。
仓库或市场的规划包含对预期查询所需的分析类型和数据的考虑。以允许访问财务信息以及访问产品属性、用户资料等更典型数据的方式设计仓库可能很有用。
将数据挖掘指标转换为财务术语 - 常用的数据挖掘指标是“提升度”的度量。“提升度”是使用特定模型或模式所实现的目标与不使用模型时的基准比率相关的度量。高值意味着实现了很多目标。看起来似乎可以简单地根据“提升度”做出决策。
准确性 - 准确性是衡量模型与已支持数据中的属性关联结果的程度。有几种准确性度量方法,但所有准确性度量都取决于所使用的信息。实际上,值可能缺失或近似,或者数据可能已被多个过程更改。
这是探索和开发的过程,它可以决定接受数据中特定数量的误差,特别是如果数据的特征相当一致。例如,即使特定商店始终使用错误的会计技术,根据过去销售额预测特定商店销售额的模型也可能具有强大的相关性和很高的准确性。因此,准确性测量应通过可靠性评估来平衡。