为了节省内存,最好是分块读取大型CSV文件,而不是尝试一次加载整个文件。然后,每个块都可以舒服地放入内存中。这是使用read_csv()
的chunksize
参数完成的。
每个块都作为其自己的数据文件返回,然后可以根据需要将其写出到单独的CSV文件中。例如:
import pandas as pd
with pd.read_csv("large.csv", chunksize=1000) as reader:
for chunk_number, df_chunk in enumerate(reader, start=1):
print(chunk_number)
df_chunk.to_csv(f"large_chunk{chunk_number:03}.csv", index=False)
这将创建多个名为large_chunk001.CSV
的输出CSV文件,以此类推。每个块包含1000行(我建议使用大得多的行)。
问题内容: 我找不到关于Returning子句的等效解决方案 我在SQLAlchemy中做到了: 我需要在执行DELETE语句时返回item_id,sub_item_id集。 问题答案: 要按原样执行查询,请使用Core构造:
因此,我能够使用CryptoJS在javascript中实现这一点 这给了我一个JSON输出 然而,我不太熟悉Python,但我想知道是否有可能在python中执行相同类型的AES解密。谢啦
在我的课堂上,我们使用方法来计算文本文件中的数据。如果我有一个看起来像这样的文件: 有没有无论如何从文件中提取此数据,然后将其发送到一个方法来计算,然后返回该计算以显示在main上?我很困惑Java如何跳过每一行,计算数字而不是人名。我在考虑使用和。但是,如果我应该将这些文本文件行变量读取为双打,我如何能够设置字符串读取文本文件中的行?抱歉问了你这么多问题我纠结了很久快把我逼疯了
问题内容: 我希望用户输入时间,例如12:00,但是我需要弄清楚一些事情,我实在是太可惜了。 我可以将文字限制为5个字符吗? 我可以在代码中嵌入冒号,以便用户无法删除它吗? 最后,我可以接受该代码并验证它只是数字(当然忽略了冒号) 问题答案: 答案是使用JFormattedTextField和MaskFormatter。 例如: Java编译器将要求您在创建MaskFormatter时捕获或抛出P
问题内容: 有谁知道我可以使用node.js读取文件元数据的方法吗?对于 例如,我想读的“细节” jpeg格式的选项卡上的“注释”属性 的文件(在Windows计算机上)。 问题答案: 有许多NPM包可用于读取EXIF数据。例如:
问题内容: 上面显示了以下错误: 因此,我必须这样做: 但是,没有简单的方法可以做到这一点吗? 问题答案: 要删除列表中元素的首次出现,只需使用: 请注意,它不会删除所有出现的元素。为此使用列表理解。