异常检测的应用有哪些?
在异常检测中,目标是发现与多个对象不同的对象。通常,异常对象被称为离群值,因为在数据的散点图上,它们远离多个数据点。异常检测被称为偏差检测,因为异常对象的属性值与预期或一般的属性值存在本质上的偏差,或者作为异常挖掘,因为异常在多种意义上都是异常的。
异常检测的应用多种多样,如下所示:
**欺诈检测** - 持有信用卡的某人的购买行为与最初持有人的购买行为不同。信用卡公司试图通过查看表明盗窃的购买模式或感知与一般行为的偏差来识别盗窃。相同的方法用于不同类型的欺诈。
**入侵检测** - 不幸的是,对计算机系统和计算机网络的攻击很常见。虽然一些攻击(包括旨在禁用或压倒计算机和网络的攻击)很明显,但其他攻击(包括旨在秘密收集数据的攻击)很难识别。通过观察系统和网络中的异常行为,可以识别其中一些入侵。
**生态系统干扰** - 在现实世界中,存在一些可能对人类产生重大影响的自然事件。例如,飓风、洪水、干旱、热浪和火灾。目标是预测这些事件发生的可能性及其原因。
**公共卫生** - 在一些国家,医院和医疗诊所将一些统计数据报告给国家机构以进行进一步分析。例如,如果一个城市的一些儿童接种了某种特定疾病(如麻疹)的疫苗,那么在该城市的一些医院散布的一些病例的出现就是一个异常事件,可能表明该城市的疫苗接种计划存在问题。
**医学** - 对于特定患者而言,异常的症状或检查结果可能表明潜在的健康问题。但是,特定的检查结果是否异常可能取决于患者的多种特征,包括年龄和性别。此外,将结果分类为异常与否需要付出代价——如果患者是活跃的,则需要进行更多不必要的检查,如果病情未被诊断和治疗,则可能对患者造成伤害。
尽管一些当前对异常检测的兴趣是由软件驱动的,在这些软件中异常是目标,但从历史上看,异常检测一直被认为是一种增强对一般数据对象分析的技术。
例如,少量离群值可能会改变一组值的均值和标准差,或者改变聚类算法创建的聚类集。因此,异常检测是数据预处理的一个组成部分。