什么是CBR?
CBR代表基于案例推理。CBR分类器需要一个问题解决方案数据库来阐明新的问题。与最近邻分类器(将训练元组保存为欧几里得空间中的点)不同,CBR将元组或“案例”保存为难以进行符号表示的问题解决方法。
CBR的各种商业应用包括客户服务帮助台的问题解决,其中案例描述了与产品相关的诊断问题。CBR已被用于工程和法律等领域,其中案例分别为技术设计或法律裁决。
医学教育是CBR的应用之一,其中患者病史和治疗方法用于支持诊断和考虑新患者。在给出一个新的案例进行定义时,基于案例的推理器将测试是否存在相同的训练案例。如果发现一个,则恢复该案例的伴随解决方案。
如果没有发现可互换的案例,则基于案例的推理器将搜索具有与新案例相同的元素的训练案例。这些训练案例可以被视为新案例的邻居。
如果案例被定义为图形,则包含搜索与新案例中的子图相同的子图。基于案例的推理器尝试设置相邻训练案例的解决方案以建议新案例的解决方案。如果单个解决方案的不兼容性增加,则回溯以搜索不同的解决方案可能很重要。
基于案例的推理器可以使用背景知识和问题解决方法来提出可能的组合解决方案。基于案例推理中存在一些挑战,包括发现最佳相似性度量(例如,用于连接子图)和组合解决方案的合适方法。
其他挑战包括选择用于索引训练案例的显著特征以及开发有效的索引技术。随着存储案例数量的增加,精度和效率之间的权衡会显现出来。
CBR中有两种方法如下:
数据挖掘只是KDD过程的一个元素,该过程可能包括访问多个文件、清理数据和执行结果。数据挖掘搜索也可能非常耗时。关于搜索结果和整个KDD过程的数据可以存储在一个案例中,这样就不会浪费更多时间来多次挖掘相同的数据。
CBR可用于支持数据库中关于自然的一些背景知识,例如,分类器的特征权重可以从CBR工具中了解。在贝叶斯网络中,网络的机制可以由CBR工具(模型构建)设置,利用其“专家知识”和使用DM算法理解的参数。