贝叶斯规则在数据结构中的应用
贝叶斯规则提供了一种根据新的相关证据更新我们信念的方法。例如,如果我们试图给出某人患癌症的概率,我们最初的结论可能是根据人口中患癌症的百分比。但是,如果得到额外的证据,例如该人吸烟,我们可以更新我们的概率,因为已知该人吸烟的情况下,患癌症的概率更大。这允许我们利用先验知识来改进概率估计。
规则解释如下:
P⟮C|D⟯=P⟮D|C⟯P⟮C⟯P⟮D⟯
在这个公式中,C是我们想要计算概率的事件,D是与C某种程度上相关的新的证据。
P(C|D) 表示后验概率;这是我们试图估计的。在上面的例子中,它是“已知该人吸烟的情况下患癌症的概率”。
P(D|C) 表示似然度;这是在我们的初始假设成立的情况下观察到新证据的概率。在上面的例子中,它是“已知该人患癌症的情况下吸烟的概率”。
P(C) 表示先验概率;这是在没有任何额外信息的情况下我们假设的概率。在上面的例子中,它是“患癌症的概率”。
P(D) 表示边缘似然;这是观察到证据的总概率。在上面的例子中,它是“吸烟的概率”。在贝叶斯规则的许多应用中,这都被忽略了,因为它主要起到归一化的作用。
广告