解释什么是神经元,在机器学习中的神经网络的语境下。


神经元是一个数学函数,它接收一个或多个值作为输入,并输出一个单一的数值。

它可以定义如下:

这里,'f' 指的是函数。

  • 我们首先计算输入 xi 和权重 wi 的加权和。

  • 权重 wi 也称为激活值或激活函数。

  • 输入 xi 可以是表示输入数据的数值,或者如果神经元属于神经网络,它可以是来自其他神经元的输出。

  • 权重 wi 是一个数值,可以用来表示输入的强度或神经元之间连接链接的强度。

  • 权重 'b' 是一个特殊的称为偏置的值,其输入始终为 1。

  • 偏置 'b' 用于允许超平面从坐标系的中心偏移。

  • 如果不使用偏置,神经元将具有有限的表示能力。

加权和的结果作为输入传递给激活函数 f,也称为传递函数。

有不同类型的激活函数,但它们都必须满足非线性的要求。

一个重要的观察结果是,神经元类似于逻辑回归和感知器。

神经元可以理解为逻辑回归和感知器算法的广义版本。如果使用逻辑函数或阶跃函数作为激活函数,则神经元可以分别用作逻辑回归或感知器。

此外,如果我们不使用任何激活函数,神经元就变成了一个线性回归问题。

先前定义的激活值可以解释为向量 w 和向量 x 的点积。

如果 -,则向量 x 将垂直于权重向量 w。

因此,所有向量 x,

在特征空间 Rn 中定义一个超平面,其中 n 是 x 的维度。

让我们用简单的术语来理解以上陈述 - 如果激活函数是 f(x) = x,并且我们有一个单一的输入值 x,则神经元的输出变为 y = wx + b。这是线性方程。

这表明在单维输入空间中,神经元基本上给出了直线的方程,即定义了一条直线。

如果我们对两个或多个输入可视化相同内容,则神经元定义了一个平面。如果输入维度是任意数量,则神经元定义了一个超平面。

感知器(神经元)仅适用于线性可分的类别,这是因为它定义了一个超平面。为了克服这一限制,神经元被组织成神经网络。

更新于:2020年12月10日

276 次浏览

开启您的 职业生涯

通过完成课程获得认证

开始学习
广告

© . All rights reserved.