我正在尝试将包含文本信息的文件保存为csv格式。但是,在熊猫中使用“to_csv”(不指定任何内容)后,保存文件,然后使用pd。读取csv以重新打开文件。它将向我显示以下错误消息:
ParserError: Error tokenizing data. C error: Buffer overflow caught - possible malformed input file.
但是如果我读熊猫的csv文件pd.read_csv('file.csv',lineterminator='\n')。它将正确打开文件。
然而,我需要使用一个软件来处理这些文本文件,软件打开文件的方式与Excel打开csv文件的方式相同,我不能像在python中那样指定lineterminator='\n'。如果我使用该软件打开csv文件,列中的一些文本将转到其他行。索引378和379之间的文本应该在378行中在一起。但是,它们转到其他行并转到索引列。
id text
378 1 Good morning. This row's text goes to the following rows
Dot dot NaN NaN
HELLO NaN NaN
Apple NaN NaN
379 2 This row is correct
有人知道如何解决这个问题,当我使用pandas.to_csv保存数据帧?如果我想在Excel这样的软件中正确打开文件,我应该指定什么?
谢谢你的回复。我发现了问题所在。它是文本中的“\r”。我删除了文本中的所有'\r',现在它可以工作了。谢谢1
试试这个:
df = pd.read_csv('file.csv', error_bad_lines=False)
问题内容: 我有一个熊猫DataFrame,我想上传到新的CSV文件。问题是在将文件传输到s3之前,我不想在本地保存文件。是否有像to_csv这样的方法可以将数据帧直接写入s3?我正在使用boto3。 这是我到目前为止的内容: 问题答案: 您可以使用:
问题内容: 我正在学习,我想知道是否存在将更改写入文件的选项,类似于我使用选项将更改保存到文件的位置。 我确实知道我可以使用重定向来编写更改。但是,有选择吗? 问题答案: 在最新的GNU Awk(从4.1.0版本开始)中,它具有“就地”文件编辑的选项: 使用新工具构建的“ inplace”扩展名,可以用来模拟GNU“ ”特性。[…] 用法示例: 要保留备份:
我正在保存非常大的数据。从R到PostgreSQL数据库的帧(3000万行),它杀死了我的电脑。由于这是dplyr生成的计算结果,我想使用这个软件包的一些内置功能,但复制到对如此大的表不起作用。有什么建议吗?
问题内容: import csv 我得到奇怪的输出!此代码有什么问题? 问题答案: 用途:
我有创建csv文件的asp页面。问题是这个csv文件是作为UTF-8创建的,没有BOM,当我打开它时,一些标志不正确可见。我应该更改什么才能将其保存为UTF-8 with BOM?如果我在记事本中手动将其转换为UTF-8 With BOM,它就可以工作。 谢谢
问题内容: 我已经尝试了所有可以使用的示例,但不能简单地将JSON数据保存到主机上的JSON文件中。我想从一个尽可能简单的保存方法开始,所以我有一个起点。 这就是我得到的: 基本上,我的 index.html中 有一个按钮,单击后应将数据保存到我的general.json文件中(与index.html相同的位置)。 使用 myscript.js中的 id选择器,我可以这样做: 如您所见,我想存储f