当前位置: 首页 > 面试题库 >

使用熊猫导入每行具有不同列数的csv

有玄天
2023-03-14
问题内容

使用Pandas或CSV模块将每行具有不同列数的CSV导入Pandas DataFrame的最佳方法是什么。

"H","BBB","D","Ajxxx Dxxxs"
"R","1","QH","DTR"," "," ","spxxt rixxls, raxxxd","1"

使用此代码:

import pandas as pd
data = pd.read_csv("smallsample.txt",header = None)

产生以下错误

Error tokenizing data. C error: Expected 4 fields in line 2, saw 8

问题答案:

在read_csv()中提供列名列表应该可以解决问题。

例如:names = [‘a’,’b’,’c’,’d’,’e’]

https://github.com/pydata/pandas/issues/2981

编辑:如果您不想提供列名,请执行尼古拉斯的建议



 类似资料:
  • 使用Pandas或CSV模块将每行具有不同列数的CSV导入Pandas数据框的最佳方法是什么。 使用此代码: 生成以下错误

  • 我肯定错过了一些简单的东西。尝试合并熊猫中的两个数据帧,它们的列名基本相同,但右边的数据帧有一些左边没有的列,反之亦然。 我已尝试使用外部联接进行联接: 但这会产生: 我还指定了一个要连接的列(例如,on="id"),但这会重复所有列,除了"id",如attr_1_x、attr_1_y,这并不理想。我还传递了整个列列表(有很多)到on: 其产生: 我错过了什么?我想得到一个附加了所有行的df,并且

  • 我正在尝试使用GridLayoutManager构建一个RecyclerView,它每行有一个可变的列计数,如下所示: 同一行中所有项目的宽度之和将始终为屏幕宽度。 我试图重新组织项目列表,按行列表分组,然后每行膨胀一个线性布局。它不太好。 所以我被困住了,没有任何想法。任何帮助都将非常感激

  • 问题内容: 假设我有一个数据框如下 现在,我希望a和b列不同的行。所以预期的输出是 我怎样才能做到这一点? 问题答案: 我喜欢可读性,请使用: 输出:

  • 我想对两个不同的数据帧执行一些sql操作。不幸的是,就像我处理的数据一样,拼写通常是不同的。 下面是一个示例,其中userid属于df1,username属于df2。有人帮我吗?

  • 我有一个pd DataFrame列,其中日期值的格式不同。例如“YYYY-MM-DD hh:MM:ss”和“DD.MM”。“YYYY”甚至“DD.MM”我想将它们全部转换为一种格式(例如,“YYYY-MM-DD”),并(在许多事情中)尝试过 查找日期未写为“YYYY-MM-DD hh:MM:ss”的行。然而,这不起作用。 因此,我检查了列的类型 然后我检查了一下 并收到了诸如类的datetime之