- 数据挖掘教程
- 数据挖掘 - 首页
- 数据挖掘 - 概述
- 数据挖掘 - 任务
- 数据挖掘 - 问题
- 数据挖掘 - 评估
- 数据挖掘 - 术语
- 数据挖掘 - 知识发现
- 数据挖掘 - 系统
- 数据挖掘 - 查询语言
- 分类与预测
- 数据挖掘 - 决策树归纳
- 数据挖掘 - 贝叶斯分类
- 基于规则的分类
- 数据挖掘 - 分类方法
- 数据挖掘 - 聚类分析
- 数据挖掘 - 文本数据挖掘
- 数据挖掘 - WWW挖掘
- 数据挖掘 - 应用与趋势
- 数据挖掘 - 主题
- 数据挖掘有用资源
- 数据挖掘 - 快速指南
- 数据挖掘 - 有用资源
- 数据挖掘 - 讨论
数据挖掘 - 贝叶斯分类
贝叶斯分类基于贝叶斯定理。贝叶斯分类器是统计分类器。贝叶斯分类器可以预测类成员概率,例如给定元组属于特定类的概率。
贝叶斯定理
贝叶斯定理以托马斯·贝叶斯命名。有两种类型的概率:
- 后验概率 [P(H/X)]
- 先验概率 [P(H)]
其中X是数据元组,H是一些假设。
根据贝叶斯定理:
贝叶斯信念网络
贝叶斯信念网络指定联合条件概率分布。它们也称为信念网络、贝叶斯网络或概率网络。
信念网络允许在变量子集之间定义类条件独立性。
它提供因果关系的图形模型,可以在其上进行学习。
我们可以使用训练好的贝叶斯网络进行分类。
定义贝叶斯信念网络的两个组成部分:
- 有向无环图
- 一组条件概率表
有向无环图
- 有向无环图中的每个节点表示一个随机变量。
- 这些变量可以是离散值或连续值。
- 这些变量可能对应于数据中给出的实际属性。
有向无环图表示
下图显示了六个布尔变量的有向无环图。
图中的弧允许表示因果知识。例如,肺癌受一个人家族肺癌病史以及这个人是否吸烟的影响。值得注意的是,给定我们知道病人患有肺癌,变量“阳性X光”与病人是否有家族肺癌病史或病人是否吸烟无关。
条件概率表
变量LungCancer (LC) 的值的条件概率表显示其父节点FamilyHistory (FH)和Smoker (S) 的值的每种可能组合,如下所示:
广告