当前位置：首页 > 面试题库 >

熊猫稀疏dataFrame到稀疏矩阵，而不在内存中生成密集矩阵

傅正豪

2023-03-14

问题内容：

有没有一种html" target="_blank">方法可以从a转换pandas.SparseDataFrame为scipy.sparse.csr_matrix，而不会在内存中生成密集矩阵？

scipy.sparse.csr_matrix(df.values)

不起作用，因为它生成一个密集矩阵，该矩阵被强制转换为csr_matrix。

提前致谢！

问题答案：

熊猫文档讨论了将稀疏稀疏性实验转换为SparseSeries.to_coo：

http://pandas-docs.github.io/pandas-docs-travis/sparse.html#interaction-with-
scipy-sparse

================

编辑-这是来自multiindex的特殊功能，而不是数据框。参见其他答案。注意日期的差异。

============

从0.20.0开始，存在sdf.to_coo()和的multiindex
ss.to_coo()。由于稀疏矩阵本质上是2d的，因此对于（有效）1d数据序列要求多索引是有意义的。而数据框可以代表一个表或二维数组。

当我第一次回答这个问题时，这个稀疏的数据框/系列功能是实验性的（2015年6月）。

类似资料：

从numpy python中的稀疏矩阵生成密集矩阵

问题内容：我有一个Sqlite数据库，其中包含以下类型的架构：该表包含术语及其在文档中的各自计数。喜欢该矩阵可以被视为稀疏矩阵，因为每个文档都包含很少的具有非零值的项。我将如何使用numpy从稀疏矩阵创建密集矩阵，因为我必须使用余弦相似度来计算文档之间的相似度。这个密集的矩阵看起来像一个表格，第一列为docid，所有术语列为第一行，其余单元格将包含计数。问题答案：我用熊猫解决了这个问
稀疏矩阵(Sparse Matrix)

稀疏矩阵(Sparse Matrix) 注：压缩存储的矩阵可以分为特殊矩阵和稀疏矩阵。对于那些具有相同元素或零元素在矩阵中分布具有一定规律的矩阵，被称之为特殊矩阵。对于那些零元素数据远远多于非零元素数目，并且非零元素的分布没有规律的矩阵称之为稀疏矩阵。 1. 稀疏矩阵的概念在矩阵中，若数值为0的元素数目远远多于非0元素的数目时，则称该矩阵为稀疏矩阵。与之相反，若非0元素数目占大多数时，则称该矩阵
从SciPy稀疏矩阵填充熊猫SparseDataFrame

问题内容：我注意到Pandas现在已支持稀疏矩阵和数组。目前，我创建这样的：有没有办法用或创建一个？转换为密集格式会严重破坏RAM。谢谢！问题答案：不支持直接转换ATM。欢迎捐款！试试这个，在内存上应该没问题，因为SpareSeries很像csc_matrix（用于1列），而且空间效率很高
2.5. SciPy 中稀疏矩阵

2.5.1 介绍 (密集) 矩阵是: 数据对象存储二维值数组的数据结构重要特征: 一次分配所有项目的内存通常是一个连续组块，想一想Numpy数组快速访问个项目(*) 2.5.1.1 为什么有稀疏矩阵？内存，增长是n**2 小例子（双精度矩阵）: In [2]: import numpy as np import matplotlib.pyplot as plt x = np.li
稀疏矩阵行列式

我正在实现一个稀疏矩阵类，使用映射向量来存储数据（映射表示矩阵的一行，其中键是列的索引，值是该位置的maitrix的值）我已经编写了计算行列式的函数，但我不知道是否有一种方法可以计算这种节省的时间（因为矩阵是稀疏的，大多数值为零）在这里我的实现：这是类接口我计算行列式的方式是什么？假设运算符（）以这种方式重载提前感谢您的帮助
CSV到Python中的稀疏矩阵

问题内容：我有一个很大的csv文件，其中列出了图中节点之间的连接。例： 0001,95784 0001,98743 0002,00082 0002,00091 因此，这意味着节点id 0001连接到节点95784和98743，依此类推。我需要将其读入numpy中的稀疏矩阵。我怎样才能做到这一点？我是python的新手，所以有关此的教程也将有所帮助。问题答案：使用scipy的lil_matri

相关阅读

C语言实现稀疏矩阵 Python使用稀疏矩阵节省内存实例使用SciPy / Numpy在Python中连接稀疏矩阵 C++ 实现稀疏矩阵的压缩存储的实例 C++ 数据结构之对称矩阵及稀疏矩阵的压缩存储

相关文章

矩阵的压缩存储特殊矩阵——三对角矩阵(Tridiagonal Matrix)R语言矩阵 NumPy矩阵乘法 NumPy Matrix矩阵库

相关问答

Scipy稀疏矩阵-密集向量乘法性能-块与大型矩阵稀疏矩阵的最小分量划分在Python中加载matlab稀疏矩阵（matlab v 7.3）用pyspark并行scipy-csr稀疏矩阵实现大矩阵乘法将稀疏矩阵与Keras和Tensorflow结合使用

相关工具

熊猫Flash播放器中国制霸生成器 sitemap.xml 生成器 dataframe-js TT内存清理

相关文档

Linux 内核揭密设计数据密集型应用 Xcode Server 持续集成指南 lemp PHP 集成运行环境 Duang 基于配置自动生成 CMS