什么是假设检验?
假设检验是将数据整合到公司决策过程的最简单方法。假设检验的目的是证实或反驳预先设定的想法,它是几乎所有数据挖掘工作的组成部分。
数据挖掘人员在方法之间来回切换,首先为观察到的行为想出可能的描述,并让这些假设决定要计算的数据。
假设检验是科学家和统计学家传统上终生都在做的事情。假设是一种提出的解释,其有效性可以通过分析数据来检验。此类信息可以通过观察轻松收集,或通过实验(包括测试邮件)创建。
当假设检验揭示出一直指导组织在行业领域行动的假设是错误时,它最有价值。例如,假设一个组织的广告依赖于关于产品或服务的目标市场以及响应特征的几个假设。值得检验这些假设是否得到实际响应的支持。
一种方法是在不同的广告中使用不同的呼入号码,并记录每个回复者拨打的号码。然后可以将通话过程中收集的信息与广告旨在覆盖的人群特征进行比较。
产生假设的关键是从整个组织以及在适当情况下从组织外部获取不同的输入。通常,启动想法流动所需的一切只是一个明确的问题陈述——尤其是在它以前从未被识别为问题的情况下。
问题未被识别的情况比人们想象的要多,因为它们没有被用于评估组织绩效的指标所捕获。
如果一个组织一直根据每个月产生的多次新销售来计算其销售队伍,那么销售人员可能从未认真考虑过新用户保持活跃的时间或他们在与组织建立关联期间花费了多少钱的问题。
假设检验当然有用,但总有它不足的时候。本书其余部分中描述的数据挖掘技术都是为了通过基于数据创建模型来学习新事物而设计的。
从最一般的意义上讲,模型是对事物如何运作的解释或描述,它能够很好地反映现实,因此可用于对现实世界进行推断。
广告