问题：

导入时忽略Python-Pandas数据帧\

阮星火

2023-03-14

import pandas as pd
import numpy as np
df_1st_conns = pd.read_csv("D:\Downloads\LinkedIn\DataV2\1st_degree_nbrs.csv", error_bad_lines=False)

b'Skipping line 22813: expected 6 fields, saw 7\nSkipping line 62807: expected 6 fields, saw 7\n'
b'Skipping line 152688: expected 6 fields, saw 7\nSkipping line 170013: expected 6 fields, saw 7\nSkipping line 222565: expected 6 fields, saw 7\nSkipping line 222644: expected 6 fields, saw 7\nSkipping line 240790: expected 6 fields, saw 7\n'

共有1个答案

庄新翰

2023-03-14

也许您可以创建一个新文件，将所有反斜杠替换为空字符串“”或其他替换字符。

示例片段：

input_csv_filename = "original.csv"
output_csv_filename = "no_backslashes.csv"

# Read original contents
with open(input_csv_filename, 'rb') as f:
    csv_contents = f.read()

# Replace backslash with empty string
# b'\\' is the bytes literal for b'\'
csv_contents = csv_contents.replace(b'\\', b'')

# Write replaced contents to the output csv file
with open(output_csv_filename, 'wb') as f:
    f.write(csv_contents)

然后，您可以使用代码读取输出csv文件：

import pandas as pd

df = pd.read_csv(output_csv_filename)

类似资料：

MySQL：导入时忽略错误？

我正在导入一个相当大的数据库。文件中几乎有1,000,000行。问题是我在尝试导入数据库时遇到语法错误。上面写着：第8428420行错误1064（42000）：您的SQL语法中有错误；检查与您的MySQL server版本相对应的手册，以获得在“ 致命错误：中超过600秒的最大执行时间”附近使用的正确语法通常我会打开.sql文件并修复错误。但我的电脑真的很难打开这个文件。在导入MySQL数据
Python-处理CSV数据时如何忽略第一行数据？

问题内容：我要Python从一列CSV数据中打印最少的数字，但是第一行是列号，我不希望Python将第一行考虑在内。如何确定Python忽略第一行？到目前为止，这是代码：你还能解释你在做什么，而不仅仅是给出代码吗？我对Python非常陌生，并希望确保我了解所有内容。问题答案：你可以使用模块类的实例来推断CSV文件的格式，并检测是否存在标头行以及仅在必要时才跳过第一行的内置函数：由于在你
RabbitMQ：忽略prefetch（）会导致数据并发吗？

场景：我只有一个生产者和消费者，只有一个队列来传输消息。使用者将根据已使用该值的消息更新DB上的值。不应将任何操作并行发送到DB。所以，我们不应该做任何导致数据库上数据并发的事情。我使用一次接收一条消息。删除是否会导致多个操作并行发送到DB？
导入Java POI时忽略导出到excel的空行Java POI

知道为什么在导出并再次导入后，调用sheet.rowiterator（）时会忽略空行吗？
如何从mongodb导入数据到pandas？

问题内容：我需要分析mongodb中的集合中有大量数据。如何将这些数据导入熊猫？我是pandas和numpy的新手。编辑：mongodb集合包含带有日期和时间标记的传感器值。传感器值是float数据类型。样本数据：问题答案：可能会帮助您，以下是我正在使用的一些代码：
将Google Spreadsheet CSV导入Pandas数据框

问题内容：我将文件上传到Google电子表格（以制作带有数据的公共示例IPython Notebook），我使用的本机文件可以读入Pandas Dataframe中。因此，现在我使用以下代码读取电子表格，可以正常工作，但只能以字符串形式输入，而且我没有运气试图将其重新放入数据框（可以获取数据）数据最终看起来像：（第一行标题）引入磁盘驻留文件的本机pandas代码如下所示：一个“干净”的解决

导入时忽略Python-Pandas数据帧\

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档