神经网络数学构建模块

精华

小牛编辑

175浏览

2023-03-14

数学在任何机器学习算法中都是至关重要的，并且包括各种核心数学概念，以便以特定方式设计正确的算法。

下面提到了数学对机器学习和数据科学的重要性 -

数学相当

现在，让我们来看看机器学习中的主要数学概念，从自然语言处理的角度来看这数学概念很重要 -

矢量

向量(Vector)是连续或离散的数字数组，由向量组成的空间称为向量空间。向量的空间维度可以是有限的也可以是无限的，但机器学习和数据科学问题涉及固定长度向量。

矢量表示显示如下 -

temp = torch.FloatTensor([23,24,24.5,26,27.2,23.0])
temp.size()
#Output - torch.Size([6])

在机器学习中，经常要处理多维数据。因此，向量变得非常关键，并且被视为任何预测问题陈述的输入特征。

标量

标量(Scalar)是一个零维度，只包含一个值。在PyTorch中，它不包括零维度的特殊张量; 因此声明将如下 -

x = torch.rand(10)
x.size()
# Output - torch.Size([10])

矩阵

大多数结构化数据通常以表格或特定矩阵的形式表示。下面将使用一个名为Boston House Prices的数据集，该数据集可以在Python scikit-learn机器学习库中找到。

boston_tensor = torch.from_numpy(boston.data)
boston_tensor.size()

#Output: torch.Size([506, 13])

boston_tensor[:2]

# Output:
# Columns 0 to 7
# 0.0063 18.0000 2.3100 0.0000 0.5380 6.5750 65.2000 4.0900
# 0.0273 0.0000 7.0700 0.0000 0.4690 6.4210 78.9000 4.9671
# Columns 8 to 12
# 1.0000 296.0000 15.3000 396.9000 4.9800
# 2.0000 242.0000 17.8000 396.9000 9.1400