import pandas as pd
import numpy as np
df_1st_conns = pd.read_csv("D:\Downloads\LinkedIn\DataV2\1st_degree_nbrs.csv", error_bad_lines=False)
b'Skipping line 22813: expected 6 fields, saw 7\nSkipping line 62807: expected 6 fields, saw 7\n'
b'Skipping line 152688: expected 6 fields, saw 7\nSkipping line 170013: expected 6 fields, saw 7\nSkipping line 222565: expected 6 fields, saw 7\nSkipping line 222644: expected 6 fields, saw 7\nSkipping line 240790: expected 6 fields, saw 7\n'
也许您可以创建一个新文件,将所有反斜杠替换为空字符串“”
或其他替换字符。
示例片段:
input_csv_filename = "original.csv"
output_csv_filename = "no_backslashes.csv"
# Read original contents
with open(input_csv_filename, 'rb') as f:
csv_contents = f.read()
# Replace backslash with empty string
# b'\\' is the bytes literal for b'\'
csv_contents = csv_contents.replace(b'\\', b'')
# Write replaced contents to the output csv file
with open(output_csv_filename, 'wb') as f:
f.write(csv_contents)
然后,您可以使用代码读取输出csv文件:
import pandas as pd
df = pd.read_csv(output_csv_filename)
我正在导入一个相当大的数据库。文件中几乎有1,000,000行。问题是我在尝试导入数据库时遇到语法错误。上面写着: 第8428420行错误1064(42000):您的SQL语法中有错误;检查与您的MySQL server版本相对应的手册,以获得在“ 致命错误:中超过600秒的最大执行时间”附近使用的正确语法 通常我会打开.sql文件并修复错误。但我的电脑真的很难打开这个文件。 在导入MySQL数据
问题内容: 我要Python从一列CSV数据中打印最少的数字,但是第一行是列号,我不希望Python将第一行考虑在内。如何确定Python忽略第一行? 到目前为止,这是代码: 你还能解释你在做什么,而不仅仅是给出代码吗?我对Python非常陌生,并希望确保我了解所有内容。 问题答案: 你可以使用模块类的实例来推断CSV文件的格式,并检测是否存在标头行以及仅在必要时才跳过第一行的内置函数: 由于在你
场景: 我只有一个生产者和消费者,只有一个队列来传输消息。使用者将根据已使用该值的消息更新DB上的值。不应将任何操作并行发送到DB。所以,我们不应该做任何导致数据库上数据并发的事情。我使用一次接收一条消息。删除是否会导致多个操作并行发送到DB?
知道为什么在导出并再次导入后,调用sheet.rowiterator()时会忽略空行吗?
问题内容: 我需要分析mongodb中的集合中有大量数据。如何将这些数据导入熊猫? 我是pandas和numpy的新手。 编辑:mongodb集合包含带有日期和时间标记的传感器值。传感器值是float数据类型。 样本数据: 问题答案: 可能会帮助您,以下是我正在使用的一些代码:
问题内容: 我将文件上传到Google电子表格(以制作带有数据的公共示例IPython Notebook),我使用的本机文件可以读入Pandas Dataframe中。因此,现在我使用以下代码读取电子表格,可以正常工作,但只能以字符串形式输入,而且我没有运气试图将其重新放入数据框(可以获取数据) 数据最终看起来像:(第一行标题) 引入磁盘驻留文件的本机pandas代码如下所示: 一个“干净”的解决