机器学习中的假设是什么？

在机器学习和数据科学项目中，假设是一个经常使用的词。众所周知，机器学习是世界上最强大的技术之一，它使我们能够根据过去的经验来预测结果。此外，数据科学家和机器学习专家进行实验的目的是为了解决问题。这些机器学习专家和数据科学家会对如何解决问题做出初步的猜测。

假设

假设是一种基于不充分事实或假设的猜想或提出的解释。它仅仅是基于某些已知事实的推测，这些事实尚未得到证实。一个好的假设是经过检验的，并且会产生真或假的结果。

让我们来看一个例子，以便更好地理解假设。一些科学家认为，紫外线 (UV) 光会损害眼睛并导致失明。

在这种情况下，科学家只是说紫外线对眼睛有害，但人们推测它会导致失明。然而，这可能是无法实现的。因此，这类假设被称为假设。

在机器学习中，假设是一个数学函数或模型，它将输入数据转换为输出预测。模型的最初信念或解释是基于提供的证据。假设通常表示为一组描述模型行为的参数。

如果我们正在构建一个模型来预测房产的价格，基于其大小和位置。假设函数可能如下所示：

$\mathrm{h(x)\:=\:θ0\:+\:θ1\:*\:x1\:+\:θ2\:*\:x2}$

假设函数是 h(x)，其输入数据是 x，模型的参数是 θ0、θ1 和 θ2，特征是 x1 和 x2。

机器学习模型的目的是找到参数 θ0 到 θ2 的最佳值，以最大限度地减少预测输出标签和实际输出标签之间的差异。

换句话说，我们正在寻找最能代表输入和输出数据之间潜在关系的假设函数。

确定问题并获得证据后，下一步是建立假设。假设是对基于不足数据的问题的解释或解决方案。它作为进一步调查和实验的跳板。假设是机器学习函数，它根据某些假设将输入转换为输出。一个好的假设有助于创建准确有效的机器学习模型。一些机器学习假设如下：

零假设是一个基本假设，它指出自变量和因变量之间不存在关系。换句话说，它假设自变量对因变量没有影响。它用符号 H0 表示。如果 p 值落在显著性水平之外 (α)，则通常拒绝零假设。如果零假设成立，则确定系数是拒绝它的概率。零假设涉及到 t 检验和方差分析等检验结果。

备择假设是与零假设相矛盾的假设。它假设自变量和因变量之间存在关系。换句话说，它假设自变量对因变量有影响。它用 Ha 表示。如果 p 值小于显著性水平 (α)，则通常接受备择假设。备择假设也称为研究假设。

单尾检验是一种显著性检验，其中拒绝域位于样本分布的一端。它表示估计的检验参数大于或小于临界值，这意味着应该接受备择假设而不是零假设。它最常用于卡方分布，其中所有与之相关的临界区域都放在两个尾部中的一个。

双尾检验是一种假设检验，其中拒绝域或临界区域位于正态分布的两端。它确定被测样本是否落在某个值的范围内，如果计算值落在概率分布的两个尾部中的任何一个，则接受备择假设。α 被分成两个相等的部分，并且估计参数高于或低于假设参数，因此极值作为反对零假设的证据。

总的来说，假设在机器学习模型中起着至关重要的作用。它为模型做出预测提供了起点，并有助于指导学习过程。假设的准确性使用各种指标进行评估，例如均方误差或准确率。

假设是一个数学函数或模型，它将输入数据转换为输出预测，通常表示为一组描述模型行为的参数。它是基于不足数据对问题的解释或解决方案。一个好的假设有助于创建准确有效的机器学习模型。当没有预先知识或理论依据来推断联系的特定方向时，使用双尾假设。

Premansh Sharma

更新于：2024年10月21日

8K+ 次浏览

完成课程后获得认证