基于统计的算法有哪些类型?


基于统计的算法主要有两种类型,如下所示:

  • 回归 - 回归问题涉及根据输入值评估输出值。当用于分类时,输入值是来自数据库的值,输出值定义类别。回归可以用来阐明分类问题,但它也用于其他应用,包括预测。回归的基本形式是简单线性回归,它只包含一个预测变量和一个预测值。

    回归可以通过两种不同的方法来实现分类,如下所示:

    • 划分 - 数据根据类别划分为不同的区域。

    • 预测 - 创建公式来预测输出类别的值。

  • 贝叶斯分类 - 统计分类器用于分类。贝叶斯分类基于贝叶斯定理。贝叶斯分类器在应用于大型数据库时,具有较高的效率和速度。

    贝叶斯定理 - 令 X 为一个数据元组。在贝叶斯方法中,X 被视为“证据”。令 H 为某个假设,包括数据元组 X 属于特定类别 C。概率 P (H|X) 用于定义数据。此概率 P (H|X) 是在给定“证据”或观察到的数据元组 X 的情况下,假设 H 成立的概率。

    P (H|X) 是 H 在给定 X 条件下的后验概率。例如,假设数据元组的特征仅限于由属性年龄和收入定义的用户,并且 X 是一个 30 岁的用户,收入为 20,000 元。假设 H 是用户将购买电脑的假设。因此,P (H|X) 反映了在知道用户年龄和收入的情况下,用户 X 将购买电脑的概率。

    P (H) 是 H 的先验概率。例如,这是任何给定用户购买电脑的概率,无论年龄、收入或其他任何数据。后验概率 P (H|X) 基于比先验概率 P (H) 更多的信息,P (H) 不依赖于 X。

    同样,P (X|H) 是 X 在给定 H 条件下的后验概率。它是用户 X 年龄为 30 岁且收入为 20,000 元的概率。

    P (H)、P (X|H) 和 P (X) 可以从给定的信息中测量。贝叶斯定理提供了一种从 P (H)、P (X|H) 和 P(X) 计算后验概率 P (H|X) 的方法。它由以下公式给出:

$$P(H|X)=\frac{P(X|H)P(H)}{P(X)}$$

更新于: 2021年11月22日

8K+ 次浏览

开启您的 职业生涯

通过完成课程获得认证

立即开始
广告