当前位置: 首页 > 知识库问答 >
问题:

我有一个大的csv文件,我想删除包含“名称”的行[duplicate]

郝原
2023-03-14

我有一个大的csv文件,它包含重复的行,我想删除所有这些重复的行,包含单词“Names”

1 Names  Dates  Picture
2 Alex   6-12   4364.jpg
3 Names  Dates  Picture
4 Jade   8-11   7435.jpg
5 Names  Dates  Picture
6 Dread  1-5    8635.jpg

csv文件如下所示。我想删除所有重复“名称”“日期”“图片”的行。

我在网上尝试了不同的方法,但我找不到解决方法

我用熊猫导入csv文件df=pd.read_csv('file2022.csv')

共有2个答案

严宏朗
2023-03-14
df = df[df["Names"] != "Names"]

应在“名称”列下删除“名称”值。

王英奕
2023-03-14

您可以在此处使用drop\u duplicates:

df = pd.read_csv('test2.csv', sep='  *', engine='python', header=None, index_col=0)
df.drop_duplicates(keep=False, inplace=True)
df.reset_index(inplace=True, drop=True)
print(df)

输出:

       1     2         3
0   Alex  6-12  4364.jpg
1   Jade  8-11  7435.jpg
2  Dread   1-5  8635.jpg
 类似资料:
  • 我有一个名为df1的Python代码数据帧: 这样的排有5000排 我想删除包含TYPE=Artificial的行,我编写了以下代码,但它给出了一个错误 它给出的错误为:

  • 问题内容: 我正在使用Linux,并打算使用Shell删除一些文件。 我的文件夹中有一些文件,一些文件名包含单词“ good”,其他文件名则没有。例如: 我要删除名称中不包含“ good”的文件,因此其余文件为: 如何在shell 中使用它?我尝试使用 但这不起作用。 非常感谢! 问题答案: 此命令应执行所需的操作: 它可能比其他命令运行得更快,因为它不涉及使用正则表达式(这很慢,对于这种简单的操

  • 问题内容: 我正在尝试仅将原始文件从一个目录复制到另一个目录,但是某些文件具有相同的名称…我正在尝试使用哈希来比较文件,如果其不在目录中发送并且名称相同,它到file_name.something。目前,我正在获取一些文件,并且具有相同名称的文件正在被覆盖…任何人都可以提出建议吗? 问题答案: 您将哈希与文件名进行比较。你需要类似的东西 计算目标文件夹中每个文件的哈希值。 此外,在当前版本中,您的

  • 我正在尝试删除此df中的所有行,其中“DB Serial”列包含字符*: 我正在使用: 但我得到这个错误:

  • 我使用eclipse IDE编写简单的程序 代码如下 当我试图从命令提示符运行这个程序时,我得到了以下错误 线程“main”java.lang.noClassDeffounder中出现异常错误:RegexTestHarness(错误名称:java_pr/RegexTestHarness)位于java.lang.classloader.defineclass1(本机方法)位于java.lang.cl

  • 我想镜像两个文件夹,但排除某些文件类型(例如js文件)。我可以用 /XF选项来做到这一点。 我遇到的问题是,如果目标文件夹中有一个带有js文件的Foo文件夹,但源文件夹中没有Foo文件夹,那么下面的robocopy命令将删除目标端的Foo文件夹以及其中的js文件。 机器人复制。exe d:\Source d:\Destination/E/PURGE/XF*。js/COPYALL/FFT 我想要的是