Numpy
通过观察Python的自有数据类型,我们可以发现Python原生并不提供多维数组的操作,那么为了处理矩阵,就需要使用第三方提供的相关的包。
NumPy 是一个非常优秀的提供矩阵操作的包。NumPy的主要目标,就是提供多维数组,从而实现矩阵操作。
NumPy's main object is the homogeneous multidimensional array. It is a table of elements (usually numbers), all of the same type, indexed by a tuple of positive integers. In NumPy dimensions are called axes.
基本操作
####################################### # 创建矩阵 ####################################### from numpy import array as matrix, arange # 创建矩阵 a = arange(15).reshape(3,5) a # Out[10]: # array([[0., 0., 0., 0., 0.], # [0., 0., 0., 0., 0.], # [0., 0., 0., 0., 0.]]) b = matrix([2,2]) b # Out[33]: array([2, 2]) c = matrix([[1,2,3,4,5,6],[7,8,9,10,11,12]], dtype=int) c # Out[40]: # array([[ 1, 2, 3, 4, 5, 6], # [ 7, 8, 9, 10, 11, 12]])
####################################### # 创建特殊矩阵 ####################################### from numpy import zeros, ones,empty z = zeros((3,4)) z # Out[43]: # array([[0., 0., 0., 0.], # [0., 0., 0., 0.], # [0., 0., 0., 0.]]) o = ones((3,4)) o # Out[46]: # array([[1., 1., 1., 1.], # [1., 1., 1., 1.], # [1., 1., 1., 1.]]) e = empty((3,4)) e # Out[47]: # array([[0., 0., 0., 0.], # [0., 0., 0., 0.], # [0., 0., 0., 0.]])
####################################### # 矩阵数学运算 ####################################### from numpy import array as matrix, arange a = arange(9).reshape(3,3) a # Out[10]: # array([[0, 1, 2], # [3, 4, 5], # [6, 7, 8]]) b = arange(3) b # Out[14]: array([0, 1, 2]) a + b # Out[12]: # array([[ 0, 2, 4], # [ 3, 5, 7], # [ 6, 8, 10]]) a - b # array([[0, 0, 0], # [3, 3, 3], # [6, 6, 6]]) a * b # Out[11]: # array([[ 0, 1, 4], # [ 0, 4, 10], # [ 0, 7, 16]]) a < 5 # Out[12]: # array([[ True, True, True], # [ True, True, False], # [False, False, False]]) a ** 2 # Out[13]: # array([[ 0, 1, 4], # [ 9, 16, 25], # [36, 49, 64]], dtype=int32) a += 3 a # Out[17]: # array([[ 3, 4, 5], # [ 6, 7, 8], # [ 9, 10, 11]])
####################################### # 矩阵内置操作 ####################################### from numpy import array as matrix, arange a = arange(9).reshape(3,3) a # Out[10]: # array([[0, 1, 2], # [3, 4, 5], # [6, 7, 8]]) a.max() # Out[23]: 8 a.min() # Out[24]: 0 a.sum() # Out[25]: 36
####################################### # 矩阵索引、拆分、遍历 ####################################### from numpy import array as matrix, arange a = arange(25).reshape(5,5) a # Out[9]: # array([[ 0, 1, 2, 3, 4], # [ 5, 6, 7, 8, 9], # [10, 11, 12, 13, 14], # [15, 16, 17, 18, 19], # [20, 21, 22, 23, 24]]) a[2,3] # 取第3行第4列的元素 # Out[3]: 13 a[0:3,3] # 取第1到3行第4列的元素 # Out[4]: array([ 3, 8, 13]) a[:,2] # 取所有第二列元素 # Out[7]: array([ 2, 7, 12, 17, 22]) a[0:3,:] # 取第1到3行的所有列 # Out[8]: # array([[ 0, 1, 2, 3, 4], # [ 5, 6, 7, 8, 9], # [10, 11, 12, 13, 14]]) a[-1] # 取最后一行 # Out[10]: array([20, 21, 22, 23, 24]) for row in a: # 逐行迭代 print(row) # [0 1 2 3 4] # [5 6 7 8 9] # [10 11 12 13 14] # [15 16 17 18 19] # [20 21 22 23 24] for element in a.flat: # 逐元素迭代,从左到右,从上到下 print(element) # 0 # 1 # 2 # 3
# ... ####################################### # 改变矩阵 ####################################### from numpy import array as matrix, arange b = arange(20).reshape(5,4) b # Out[18]: # array([[ 0, 1, 2, 3], # [ 4, 5, 6, 7], # [ 8, 9, 10, 11], # [12, 13, 14, 15], # [16, 17, 18, 19]]) b.ravel() # Out[16]: # array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, # 17, 18, 19]) b.reshape(4,5) # Out[17]: # array([[ 0, 1, 2, 3, 4], # [ 5, 6, 7, 8, 9], # [10, 11, 12, 13, 14], # [15, 16, 17, 18, 19]]) b.T # reshape 方法不改变原矩阵的值,所以需要使用 .T 来获取改变后的值 # Out[19]: # array([[ 0, 4, 8, 12, 16], # [ 1, 5, 9, 13, 17], # [ 2, 6, 10, 14, 18], # [ 3, 7, 11, 15, 19]])
####################################### # 合并矩阵 ####################################### from numpy import array as matrix,newaxis import numpy as np d1 = np.floor(10*np.random.random((2,2))) d2 = np.floor(10*np.random.random((2,2))) d1 # Out[7]: # array([[1., 0.], # [9., 7.]]) d2 # Out[9]: # array([[0., 0.], # [8., 9.]]) np.vstack((d1,d2)) # 按列合并 # Out[10]: # array([[1., 0.], # [9., 7.], # [0., 0.], # [8., 9.]]) np.hstack((d1,d2)) # 按行合并 # Out[11]: # array([[1., 0., 0., 0.], # [9., 7., 8., 9.]]) np.column_stack((d1,d2)) # 按列合并 # Out[13]: # array([[1., 0., 0., 0.], # [9., 7., 8., 9.]]) c1 = np.array([11,12]) c2 = np.array([21,22]) np.column_stack((c1,c2)) # Out[14]: # array([[11, 21], # [12, 22]]) c1[:,newaxis] # 添加一个“空”列 # Out[18]: # array([[11], # [12]]) np.hstack((c1,c2)) # Out[27]: array([11, 12, 21, 22]) np.hstack((c1[:,newaxis],c2[:,newaxis])) # Out[28]: # array([[11, 21], # [12, 22]])
参考
1.NumPy官方文档
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持小牛知识库。
问题内容: 我有一个Sqlite数据库,其中包含以下类型的架构: 该表包含术语及其在文档中的各自计数。喜欢 该矩阵可以被视为稀疏矩阵,因为每个文档都包含很少的具有非零值的项。 我将如何使用numpy从稀疏矩阵创建密集矩阵,因为我必须使用余弦相似度来计算文档之间的相似度。 这个密集的矩阵看起来像一个表格,第一列为docid,所有术语列为第一行,其余单元格将包含计数。 问题答案: 我用熊猫解决了这个问
问题内容: 我正在尝试执行以下操作 如何使用Numpy数组中的所有元素轻松高效地创建集合? 问题答案: 如果需要一组元素,这是另一种可能更快的方法: PS :之间执行比较后,和一个10x100阵列上,我发现,它们都在大约相同的速度来执行。对于3x3阵列,最快的版本是迭代器版本: 我建议这样做,因为它是内存消耗较少的版本(它随阵列的大小扩展得很好)。 PPS :还有一个NumPy函数可以执行类似的操
主要内容:逐元素矩阵乘法,矩阵乘积运算,矩阵点积矩阵乘法是将两个矩阵作为输入值,并将 A 矩阵的行与 B 矩阵的列对应位置相乘再相加,从而生成一个新矩阵,如下图所示: 注意:必须确保第一个矩阵中的行数等于第二个矩阵中的列数,否则不能进行矩阵乘法运算。 图1:矩阵乘法 矩阵乘法运算被称为向量化操作,向量化的主要目的是减少使用的 for 循环次数或者根本不使用。这样做的目的是为了加速程序的计算。 下面介绍 NumPy 提供的三种矩阵乘法,从而进一步
主要内容:matlib.empty(),numpy.matlib.zeros(),numpy.matlib.ones(),numpy.matlib.eye(),numpy.matlib.identity(),numpy.matlib.rand()NumPy 提供了一个 矩阵库模块 ,该模块中的函数返回的是一个 matrix 对象,而非 ndarray 对象。矩阵由 m 行 n 列(m*n)元素排列而成,矩阵中的元素可以是数字、符号或数学公式等。 matlib.empty() matlib.emp
矩阵和魔方 在MATLAB里,矩阵由数字行列构成。有时也指1*1矩阵,它是标量,而一行或一列的矩阵指代向量。MATLAB有另外一些存储数字与非数字数据的方法,但在开始的阶段,最好将一切以矩阵看待。MATLAB内的操作被设计得尽可能接近自然语言。别的程序设计语言以一次处理一个数据,MATLAB则让你简单而快捷地处理一整个矩阵。有一个贯穿此书的很好的例子,它出现在德国的一个艺术家兼业余数学爱好者阿布列
问题内容: NumPy是一个非常有用的库,通过使用它,我发现它能够轻松处理非常大的矩阵(10000 x 10000),但是开始处理任何更大的矩阵(尝试创建50000 x 50000的矩阵)失败)。显然,这是因为需要大量内存。 是否有一种方法可以以某种方式(没有几个terrabytes的RAM)在NumPy中本地创建大型矩阵(比如说一百万乘一百万)? 问题答案: PyTables和NumPy是必经之