问题：

我如何使用dask。当我有bigdata时，将dataframe转换为\u csv

越嘉石

2023-03-14

我只想用dask保存CSV文件。我得到了超过30GB的数据。读取csv没有问题。但下班后我需要将其保存为CSV文件。它不起作用。帮助我

import dask.dataframe as dd
df = dd.read_csv("E:/bigdata/H_2015_04.dat", sep="|", header=None)
df.to_csv("E:/bigdata/1.csv")

有如下错误消息。。

文件"熊猫/_libs/parsers.pyx"，第894行，在熊猫中。_libs.parsers.TextReader.read文件"熊猫/_libs/parsers.pyx"，第916行，在熊猫中。_libs.parsers.TextReader。_read_low_memory文件"熊猫/_libs/parsers.pyx"，第993行，在熊猫中。_libs.parsers.TextReader。_read_rows文件"熊猫/_libs/parsers.pyx"，第1122行，在熊猫中。_libs.parsers.文本阅读器。_convert_column_data文件“熊猫/_libs/parsers.pyx”，第1167行，在熊猫中。_libs.parsers.文本阅读器。_convert_tokens文件“熊猫/_libs/parsers.pyx”，第1215行，在熊猫中。_libs.parsers.文本阅读器。_convert_with_dtype文件"熊猫/_libs/parsers.pyx"，第1905行，在熊猫中。_libs.parsers._try_int64内存错误

共有1个答案

朱硕

2023-03-14

文件大小导致内存错误。您可以使用以下方法一次读取部分数据

reader = pd.read_csv(file_path, iterator=True)
#Read lines 0 to 1000
chunk = reader.get_chunk(1000)
#Read lines 1000 to 2000
chunk = reader.get_chunk(1000)

类似资料：

dask dataframe如何将列转换为to_datetime

问题内容：我正在尝试将数据框的一栏转换为日期时间。在这里的讨论之后，https：//github.com/dask/dask/issues/863我尝试了以下代码：但是我收到以下错误消息我到底应该把什么放在meta之下？我应该将所有列的字典放在df中还是仅将“时间”列放在字典中？我应该放什么类型？我已经尝试过dtype和datetime64，但到目前为止它们都没有工作。谢谢，感谢您的指导，
如何使用模式将dataframe转换为avro？

如何使用用户指定的架构将dataframe转换为Avro格式？
如果我有证书，我们如何将PKCS#1转换为PKCS#7？

我知道PKCS#7=证书+可选原始数据+PKCS#1格式的签名
如何在Scala中将DataFrame转换为RDD？

有人能分享一下如何将转换为吗？
我们如何将XML文件转换为CSV？

问题内容：我有一个XML文件我必须将此XML转换为CSV文件。我听说我们可以使用XSLT进行此类操作。如何在Java中（带有/不带有XSLT）执行此操作？问题答案：用伪代码：这个快速的小循环将在每行的末尾写一个逗号，但是我敢肯定您可以弄清楚如何删除它。为了实际解析XML，我建议使用JDOM。它具有非常直观的API。
使用angularjs将UTC转换为当地时间

问题内容：作为json的回应，我正在获取UTC时区。我需要将其转换为当地时间。有人可以帮忙吗？问题答案：编辑（2017年1月2日）：请参阅@Jason的答案，它比这更好，因为它使用自定义过滤器修复日期格式-这是更Angular的方法。我的原始答案和修改内容：您可以使用过滤器格式化日期：这将输出：（假设）请参阅angularjs.org中的此文档。它有很多示例，非常有帮助！编辑：

我如何使用dask。当我有bigdata时，将dataframe转换为\u csv

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档