机器学习中的假设是什么?
在机器学习和数据科学项目中,假设是一个经常使用的词。众所周知,机器学习是世界上最强大的技术之一,它使我们能够根据过去的经验来预测结果。此外,数据科学家和机器学习专家进行实验的目的是为了解决问题。这些机器学习专家和数据科学家会对如何解决问题做出初步的猜测。
假设
什么是假设?
假设是一种基于不充分事实或假设的猜想或提出的解释。它仅仅是基于某些已知事实的推测,这些事实尚未得到证实。一个好的假设是经过检验的,并且会产生真或假的结果。
让我们来看一个例子,以便更好地理解假设。一些科学家认为,紫外线 (UV) 光会损害眼睛并导致失明。
在这种情况下,科学家只是说紫外线对眼睛有害,但人们推测它会导致失明。然而,这可能是无法实现的。因此,这类假设被称为假设。
在机器学习中定义假设
在机器学习中,假设是一个数学函数或模型,它将输入数据转换为输出预测。模型的最初信念或解释是基于提供的证据。假设通常表示为一组描述模型行为的参数。
如果我们正在构建一个模型来预测房产的价格,基于其大小和位置。假设函数可能如下所示:
$$\mathrm{h(x)\:=\:θ0\:+\:θ1\:*\:x1\:+\:θ2\:*\:x2}$$
假设函数是 h(x),其输入数据是 x,模型的参数是 θ0、θ1 和 θ2,特征是 x1 和 x2。
机器学习模型的目的是找到参数 θ0 到 θ2 的最佳值,以最大限度地减少预测输出标签和实际输出标签之间的差异。
换句话说,我们正在寻找最能代表输入和输出数据之间潜在关系的假设函数。
机器学习中假设的类型
确定问题并获得证据后,下一步是建立假设。假设是对基于不足数据的问题的解释或解决方案。它作为进一步调查和实验的跳板。假设是机器学习函数,它根据某些假设将输入转换为输出。一个好的假设有助于创建准确有效的机器学习模型。一些机器学习假设如下:
1. 零假设
零假设是一个基本假设,它指出自变量和因变量之间不存在关系。换句话说,它假设自变量对因变量没有影响。它用符号 H0 表示。如果 p 值落在显著性水平之外 (α),则通常拒绝零假设。如果零假设成立,则确定系数是拒绝它的概率。零假设涉及到 t 检验和方差分析等检验结果。
2. 备择假设
备择假设是与零假设相矛盾的假设。它假设自变量和因变量之间存在关系。换句话说,它假设自变量对因变量有影响。它用 Ha 表示。如果 p 值小于显著性水平 (α),则通常接受备择假设。备择假设也称为研究假设。
3. 单尾假设
单尾检验是一种显著性检验,其中拒绝域位于样本分布的一端。它表示估计的检验参数大于或小于临界值,这意味着应该接受备择假设而不是零假设。它最常用于卡方分布,其中所有与之相关的临界区域都放在两个尾部中的一个。
4. 双尾假设
双尾检验是一种假设检验,其中拒绝域或临界区域位于正态分布的两端。它确定被测样本是否落在某个值的范围内,如果计算值落在概率分布的两个尾部中的任何一个,则接受备择假设。α 被分成两个相等的部分,并且估计参数高于或低于假设参数,因此极值作为反对零假设的证据。
总的来说,假设在机器学习模型中起着至关重要的作用。它为模型做出预测提供了起点,并有助于指导学习过程。假设的准确性使用各种指标进行评估,例如均方误差或准确率。
结论
假设是一个数学函数或模型,它将输入数据转换为输出预测,通常表示为一组描述模型行为的参数。它是基于不足数据对问题的解释或解决方案。一个好的假设有助于创建准确有效的机器学习模型。当没有预先知识或理论依据来推断联系的特定方向时,使用双尾假设。