当前位置：首页 > 面试题库 >

使用熊猫导入每行具有不同列数的csv

有玄天

2023-03-14

问题内容：

使用Pandas或CSV模块将每行具有不同列数的CSV导入Pandas DataFrame的最佳方法是什么。

"H","BBB","D","Ajxxx Dxxxs"
"R","1","QH","DTR"," "," ","spxxt rixxls, raxxxd","1"

使用此代码：

import pandas as pd
data = pd.read_csv("smallsample.txt",header = None)

产生以下错误

Error tokenizing data. C error: Expected 4 fields in line 2, saw 8

问题答案：

在read_csv（）中提供列名列表应该可以解决问题。

例如：names = [‘a’，’b’，’c’，’d’，’e’]

https://github.com/pydata/pandas/issues/2981

编辑：如果您不想提供列名，请执行尼古拉斯的建议

类似资料：

使用Pandas导入每行不同列数的csv

使用Pandas或CSV模块将每行具有不同列数的CSV导入Pandas数据框的最佳方法是什么。使用此代码：生成以下错误
熊猫合并具有不同列的两个数据帧

我肯定错过了一些简单的东西。尝试合并熊猫中的两个数据帧，它们的列名基本相同，但右边的数据帧有一些左边没有的列，反之亦然。我已尝试使用外部联接进行联接：但这会产生：我还指定了一个要连接的列（例如，on="id"），但这会重复所有列，除了"id"，如attr_1_x、attr_1_y，这并不理想。我还传递了整个列列表（有很多）到on：其产生：我错过了什么？我想得到一个附加了所有行的df，并且
GridLayoutManager，每行具有不同的列计数

我正在尝试使用GridLayoutManager构建一个RecyclerView，它每行有一个可变的列计数，如下所示：同一行中所有项目的宽度之和将始终为屏幕宽度。我试图重新组织项目列表，按行列表分组，然后每行膨胀一个线性布局。它不太好。所以我被困住了，没有任何想法。任何帮助都将非常感激
熊猫：选择两列不同的行

问题内容：假设我有一个数据框如下现在，我希望a和b列不同的行。所以预期的输出是我怎样才能做到这一点？问题答案：我喜欢可读性，请使用：输出：
熊猫在具有不同名称的列上连接[重复]

我想对两个不同的数据帧执行一些sql操作。不幸的是，就像我处理的数据一样，拼写通常是不同的。下面是一个示例，其中userid属于df1，username属于df2。有人帮我吗？
熊猫数据列的不同格式-列与行的数据类型

我有一个pd DataFrame列，其中日期值的格式不同。例如“YYYY-MM-DD hh:MM:ss”和“DD.MM”。“YYYY”甚至“DD.MM”我想将它们全部转换为一种格式（例如，“YYYY-MM-DD”），并（在许多事情中）尝试过查找日期未写为“YYYY-MM-DD hh:MM:ss”的行。然而，这不起作用。因此，我检查了列的类型然后我检查了一下并收到了诸如类的datetime之

使用熊猫导入每行具有不同列数的csv

相关阅读

相关文章

相关问答

相关工具

相关文档