神经网络的数学基础



数学在任何机器学习算法中都至关重要,并且包含各种核心数学概念,以便以特定的方式设计正确的算法。

下面提到了数学主题对机器学习和数据科学的重要性:

machine learning

现在,让我们关注机器学习的主要数学概念,这些概念对于自然语言处理的角度来说非常重要:

向量

向量被认为是数字数组,可以是连续的或离散的,包含向量的空间称为向量空间。向量的空间维度可以是有限的或无限的,但已经观察到机器学习和数据科学问题处理的是固定长度的向量。

向量表示如下所示:

temp = torch.FloatTensor([23,24,24.5,26,27.2,23.0])
temp.size()
Output - torch.Size([6])

在机器学习中,我们处理多维数据。因此,向量变得非常关键,并且被视为任何预测问题陈述的输入特征。

标量

标量被认为具有零维,仅包含一个值。在 PyTorch 中,它不包含一个具有零维的特殊张量;因此,声明将如下进行:

x = torch.rand(10)
x.size()
Output - torch.Size([10])

矩阵

大多数结构化数据通常以表格或特定矩阵的形式表示。我们将使用一个名为波士顿房价的数据集,它在 Python scikit-learn 机器学习库中随时可用。

boston_tensor = torch.from_numpy(boston.data)
boston_tensor.size()
Output: torch.Size([506, 13])
boston_tensor[:2]
Output:
Columns 0 to 7
0.0063 18.0000 2.3100 0.0000 0.5380 6.5750 65.2000 4.0900
0.0273 0.0000 7.0700 0.0000 0.4690 6.4210 78.9000 4.9671
Columns 8 to 12
1.0000 296.0000 15.3000 396.9000 4.9800
2.0000 242.0000 17.8000 396.9000 9.1400
广告