我有一个来自AG列的数据文件,如下所示,但是当我用pd.read_csv('data.csv')
它读取数据时,它unnamed
毫无理由地在末尾打印了一个额外的列。
colA ColB colC colD colE colF colG Unnamed: 7
44 45 26 26 40 26 46 NaN
47 16 38 47 48 22 37 NaN
19 28 36 18 40 18 46 NaN
50 14 12 33 12 44 23 NaN
39 47 16 42 33 48 38 NaN
我已经多次查看过我的数据文件,但是其他任何列中都没有多余的数据。我在阅读时应如何删除此多余的列?谢谢
df = df.loc[:, ~df.columns.str.contains(‘^Unnamed’)]
In [162]: df
Out[162]:
colA ColB colC colD colE colF colG
0 44 45 26 26 40 26 46
1 47 16 38 47 48 22 37
2 19 28 36 18 40 18 46
3 50 14 12 33 12 44 23
4 39 47 16 42 33 48 38
如果CSV文件的第一列具有索引值,则可以执行以下操作:
df = pd.read_csv('data.csv', index_col=0)
问题内容: 我需要删除pandas中数据框的前三行。 我知道会删除最后一行,但我不知道如何删除前n行。 问题答案: 用途: 将为您提供一个没有前三行的新df。
问题内容: 我有数据框: df 如何删除列名,并从该数据帧?一种方法是将其写入csv文件,然后在指定header = None的情况下读取它。有没有一种方法,而无需写到csv并重新读取? 问题答案: 我认为你不能删除列名,只能通过重新设置有: 这与使用和相同: 下一个解决方案:
问题内容: 我创建了一些没有显式名称的外键。 然后我发现SQL生成了疯狂的名称,例如。猜猜它们将在不同的服务器上以不同的名称生成。 是否有任何不错的功能来删除未命名的FK约束,这些表和字段作为参数传递? 问题答案: 没有内置的过程可以完成此操作,但是您可以使用information_schema视图中的信息来构建自己的过程。 基于表的示例
如何更改pandas数据框的列标签: 到
问题内容: 我的df有3栏 我想删除df.col_1为1.0且df.col_2为0.0的行。因此,我会得到: 我试过了: 它给了我错误: 任何想法如何解决上述问题? 问题答案: drop是一种方法,您使用调用它,因此它为您提供了: 更改为(正常方法调用),它应该可以工作: 输出量
问题内容: 我有2个数据框,一个命名为USERS,另一个命名为EXCLUDE。他们两个都有一个名为“电子邮件”的字段。 基本上,我要删除EXERSUDE中包含电子邮件的USERS中的每一行。 我该怎么做? 问题答案: 您可以将和条件一起使用,通过以下方式反转布尔值: 另一个解决方案: