以下哪些领域可以应用数据挖掘技术?
以下是数据挖掘技术可用于或为入侵检测创建的领域:
为入侵检测开发数据挖掘算法 - 数据挖掘算法可用于滥用检测和异常检测。在滥用检测中,训练信息被标记为“正常”或“入侵”。然后可以更改分类器以检测已知的入侵。
该领域有多项研究包含了分类算法、关联规则挖掘和成本敏感建模的应用。异常检测构建正常行为的模型并自动检测与其显著偏差,并可以利用监督或无监督学习。
在监督技术中,模型是基于被称为“正常”的训练数据创建的。在无监督技术中,没有给出关于训练数据的任何信息。异常检测研究涉及分类算法、统计方法、聚类和异常值分析的应用。这些技术必须有效且可扩展,并且能够管理大量、高维和异构的网络数据。
关联和相关分析以及聚合以帮助选择和构建区分属性 - 关联和相关挖掘可用于发现定义网络数据的系统属性之间的关系。此类数据可以支持有关选择用于入侵检测的有用属性的见解。从聚合数据更改的新属性也可能有所帮助,包括与特定模式匹配的流量的汇总计数。
流数据分析 - 由于入侵和恶意攻击的瞬态和动态特性,在数据流环境中执行入侵检测非常重要。此外,事件本身可能是正常的,但如果被视为一系列事件中的一个元素,则会被视为恶意的。
因此,研究哪些活动序列经常一起出现、发现顺序模式以及识别异常值非常重要。用于在数据流中查找演变聚类和构建动态分类模型的其他数据挖掘技术对于实时入侵检测也很重要。
分布式数据挖掘 - 入侵可能来自多个区域并针对许多不同的目标。分布式数据挖掘技术可用于分析来自多个网络区域的网络数据以检测这些分布式攻击。
可视化和查询工具 - 必须能够访问可视化工具以查看检测到的任何异常模式。此类工具可能包括用于查看关联、聚类和异常值的特性。入侵检测系统还必须具有图形用户界面,使安全分析师能够提出有关网络数据或入侵检测结果的查询。
广告