Numpy 的 ndarray 对象

优质

小牛编辑

139浏览

2023-12-01

本小节将详述如何创建 ndarray 对象，以及如何创建特殊的 ndarray 对象。

1. ndarray 对象

ndarray，也就是我们常用的 N 维数组对象，是 Numpy 最核心的组成部分。你可以把它视为一个快速而灵活的大数据集容器，利用这种数组你可以便捷地执行一些数学运算。

ndarray 有两个显著特点：

ndarray 是一个通用的同构数据多维容器，也就是说，该容器中的每一个元素都必须是相同类型的，且每个元素在内存中都有相同存储大小的区域；
ndarray 具有矢量算术运算能力和复杂的广播能力，并具有执行速度快和节省空间的特点。

2. 创建 ndarray

2.1 numpy.array 函数

创建数组对象最简单的方法是利用 array 函数，该函数的输入为序列型对象，输出为一个含有传入数据的 Numpy 数组。 array 函数的常用调用参数如下：

numpy.array(object, dtype=None, copy=True, ndmin=0)

参数	说明
`object`	`array`的主要输入参数，可以是数组、有序序列，或者是嵌套的序列
`dtype`	数据类型，用来指定生成的`ndarray`数据结构的元素类型
`copy`	对象是否被复制，默认为`True`
`ndmin`	指定返回数组的最小维数

Tips：关于数据类型相关知识，我们会在下个小节详细讲解。

案例

以列表转换为例：

import numpy as np

data0 = [1, 4, 3, 7, 2]
arr0 = np.array(data0)
arr0

这里通过 array 函数，输入列表，输出一个数组对象。

Out:
    array([1, 4, 3, 7, 2])

在上述案例中，并未指定dtype。这是因为在通常情况下，np.array函数会尝试为新建的数组推断出一个合理的数据类型：

arr0.dtype

Out:
    dtype('int32')

可以看到自动创建的数据类型为int32。

案例

当然了，你可以在开始的时候，利用dtype参数，显式地指定数组元素的数据类型。这里我们以一个嵌套列表为例，进行说明：

data1 = [[1, 2, 3.2], [4, 5.1, 6], [7.3, 8, 9]]
arr1 = np.array(data1, dtype='float')
arr1

这里通过 array 函数，输入嵌套列表，并同时指定数据类型为 float，输出对应的数组对象。

Out:
    array([[1. , 2. , 3.2],
           [4. , 5.1, 6. ],
           [7.3, 8. , 9. ]])

查看数组对象的数据类型为float64。

arr1.dtype

Out:
    dtype('float64')

案例

也可以利用 ndmin 参数，手动指定创建数组的维数：

arr2 = np.array(data0, ndmin=2)
arr2

Out:
    array([[1, 4, 3, 7, 2]])

这里利用 ndmin 参数，手动创建了一个二维数组。

3. 常用的 ndarray 创建函数

除 np.array 之外，Numpy 内置了一些其他方法，可以快速创建一些具有特殊特征的数组。比如，利用 zeros 函数和 ones 函数可以创建一个指定大小的全 0 或全 1 的数组。

3.1 numpy.zeros 函数

zeros 函数可以创建一个指定大小的、以 0 来填充的数组。

案例

创建一个长度为 4 的全 0 数组：

np.zeros(4)

Out:
    array([0., 0., 0., 0.])

3.2 numpy.ones 函数

ones 函数可以创建一个指定大小的、以 1 来填充的数组。

案例

创建一个大小为 3×3 的全 0 数组方阵：

np.ones((3,3))

Out:
    array([[1., 1., 1.],
           [1., 1., 1.],
           [1., 1., 1.]])

需要注意的是，对于创建 2 维及以上的数组时，zeros函数和 ones 函数接收一个表示数组大小的元组 tuple 作为输入。

3.3 numpy.empty 函数

类似的，empty 函数用来创建一个指定大小的、没有具体值的数组。

案例

这里我们创建一个 3×2×3 的三维空数组：

np.empty((3,2,3))

Out:
    array([[[4.67296746e-307, 1.69121096e-306, 1.33511018e-306],
            [1.33511018e-306, 1.86917476e-306, 1.11256817e-306]],

           [[1.06811422e-306, 1.42417221e-306, 1.11260619e-306],
            [8.90094053e-307, 1.86919378e-306, 1.06809792e-306]],

           [[1.37962456e-306, 1.69111861e-306, 1.78020169e-306],
            [1.37961777e-306, 7.56599807e-307, 7.56599806e-307]]])

这里要注意一下 empty 函数的输出。因为 empty 考虑到输出全 0 数组是不安全的想法，因此很多情况下，它返回的是一些没有规律的垃圾值。

Numpy 还提供了创建单位方阵（对角线为 1，其余为 0）的方法：identity 和 eye。

3.4 numpy.identity 函数

identity 函数用来创建一个指定大小的单位矩阵（对角线为 1 的数组）。

案例

这里我们利用 identity 函数来创建一个大小为 3×3 的单位矩阵：

np.identity(3)

Out:
    array([[1., 0., 0.],
           [0., 1., 0.],
           [0., 0., 1.]])

3.5 numpy.eye 函数

eye 函数用来创建一个指定大小的、对角线为 1 的数组。

eye 函数是 identity 的升级版本。eye 函数的原型如下：

np.eye(N, M=None, k=0, dtype=<type ‘float’>)

当 k 为默认值时，eye 函数可以创建大小为 N×M，主对角线为 1 的矩阵。

案例

创建一个大小为 3×4 的主对角线为 1 的数组。

np.eye(N=3, M=4)

Out:
    array([[1., 0., 0., 0.],
           [0., 1., 0., 0.],
           [0., 0., 1., 0.]])

案例

当 k、M 均为默认值时，eye 函数的功能和 identity 一致。

例如，利用 eye 函数创建一个大小为 3×3 的单位矩阵。

np.eye(N=3)

Out:
    array([[1., 0., 0.],
           [0., 1., 0.],
           [0., 0., 1.]])

k 表示为 1 的对角线的偏移量，当 k 大于 0 时，表示向右偏移。

例如，创建一个大小为 3×4 的数组，为 1 的对角线向右偏移一位：

np.eye(N=3, M=4, k=1)

Out:
    array([[0., 1., 0., 0.],
           [0., 0., 1., 0.],
           [0., 0., 0., 1.]])

4. 小结

本小节重点讲述了如何利用序列型对象，创建一个数组序列；以及如何创建常用的特殊数组，例如：全 0 数组、全 1 数组，全空数组、对角线为 1 的数组等。