当前位置：首页 > 面试题库 >

在HDF5（PyTables）中存储Numpy稀疏矩阵

龙玺

2023-03-14

问题内容：

我在用PyTables存储numpy csr_matrix时遇到问题。我收到此错误：

TypeError: objects of type ``csr_matrix`` are not supported in this context, sorry; supported objects are: NumPy array, record or scalar; homogeneous list or tuple, integer, float, complex or string

我的代码：

f = tables.openFile(path,'w')

atom = tables.Atom.from_dtype(self.count_vector.dtype)
ds = f.createCArray(f.root, 'count', atom, self.count_vector.shape)
ds[:] = self.count_vector
f.close()

有任何想法吗？

谢谢

问题答案：

一个CSR矩阵可以从它的完全重建data，indices和indptr属性。这些只是常规的numpy数组，因此将它们作为3个单独的数组存储在pytables中，然后将它们传递回的构造函数应该没有问题csr_matrix。请参阅scipy文档。

编辑： Pietro的答案已指出该shape成员也应存储

类似资料：

numpy矩阵乘法到三角形/稀疏存储？

我正在处理一个非常大的稀疏矩阵乘法（matmul）问题。作为一个例子，让我们说： > A是一个二进制（75 x 200,000）矩阵。它很稀疏，所以我使用csc进行存储。我需要执行以下matmul操作： B=A.转置（）*A 输出将是大小为200Kx200K的稀疏对称矩阵。不幸的是，B存储在我笔记本电脑上的RAM（或“核心”）中会变得太大。另一方面，我很幸运，因为B有一些属性可以解决这个问题。
使用SciPy / Numpy在Python中连接稀疏矩阵

问题内容：使用SciPy / Numpy在Python中连接稀疏矩阵的最有效方法是什么？在这里，我使用以下内容：我想在回归中使用两个预测变量，但是当前格式显然不是我想要的格式。是否有可能获得以下信息：它太大，无法转换为深格式。问题答案：您可以使用来连接行数相同的稀疏矩阵（水平串联）：同样，您可以用于将具有相同列数的稀疏矩阵进行串联（垂直串联）。使用或将创建带有两个稀疏矩阵对象的数组
熊猫稀疏dataFrame到稀疏矩阵，而不在内存中生成密集矩阵

问题内容：有没有一种方法可以从a转换为，而不会在内存中生成密集矩阵？不起作用，因为它生成一个密集矩阵，该矩阵被强制转换为。提前致谢！问题答案：熊猫文档讨论了将稀疏稀疏性实验转换为SparseSeries.to_coo： http://pandas-docs.github.io/pandas-docs-travis/sparse.html#interaction-with- scipy-s
2.5. SciPy 中稀疏矩阵

2.5.1 介绍 (密集) 矩阵是: 数据对象存储二维值数组的数据结构重要特征: 一次分配所有项目的内存通常是一个连续组块，想一想Numpy数组快速访问个项目(*) 2.5.1.1 为什么有稀疏矩阵？内存，增长是n**2 小例子（双精度矩阵）: In [2]: import numpy as np import matplotlib.pyplot as plt x = np.li
从numpy python中的稀疏矩阵生成密集矩阵

问题内容：我有一个Sqlite数据库，其中包含以下类型的架构：该表包含术语及其在文档中的各自计数。喜欢该矩阵可以被视为稀疏矩阵，因为每个文档都包含很少的具有非零值的项。我将如何使用numpy从稀疏矩阵创建密集矩阵，因为我必须使用余弦相似度来计算文档之间的相似度。这个密集的矩阵看起来像一个表格，第一列为docid，所有术语列为第一行，其余单元格将包含计数。问题答案：我用熊猫解决了这个问
Numpy：智能矩阵乘法到稀疏结果矩阵

在使用numpy的python中，假设我有两个矩阵：稀疏矩阵密集的x*y矩阵现在我想做，它将返回一个密集的矩阵。但是，我只关心中非零的单元格，这意味着如果我这样做了，对我的应用程序不会有任何影响 <代码>S\u=S*S\u 显然，这将是对操作的浪费，因为我想把在

在HDF5（PyTables）中存储Numpy稀疏矩阵

相关阅读

相关文章

相关问答

相关工具

相关文档