当前位置: 首页 > 知识库问答 >
问题:

如果一个值只出现一次[重复],熊猫将删除行

潘国源
2023-03-14

假设我们有熊猫表:

+-------+-------------------+
| Name  |       Dog         |
+-------+-------------------+
| Alice | husky             | 
| Bob   | husky             | 
| Chris | pom               | 
| Ferri | malamute          | 
| Bob2  | corgi             | 
| Dave2 | corgi             |
+-------+-------------------+

我们如何删除只有“狗”一个条目的行?例如,这将是带有pom,雪橇犬的行。

+-------+-------------------+
| Name  |       Dog         |
+-------+-------------------+
| Alice | husky             | 
| Bob   | husky             | 
| Bob2  | corgi             | 
| Dave2 | corgi             |
+-------+-------------------+

谢谢!

共有1个答案

漆雕和昶
2023-03-14
is_multi = df["Dog"].value_counts() > 1
filtered = df[df["Dog"].isin(is_multi[is_multi].index)]
 类似资料:
  • 我有一个表,需要删除整个行,其中ID发生第二次和以后的时间,但留下第一次出现suCustoriID顺便说一下。M表的ID是主键,CustometID是重复的。因此,我需要删除所有重复的自定义ID行。 上面的代码将删除所有id,包括每个id的第一次出现,但我需要保留它们的第一次出现。请告知。

  • 我已准备好数据帧 我准备了 我想只覆盖Col2 row0,并尝试以下代码。 但是我得到了一个下面的错误。 索引错误:列表索引超出范围

  • 我有一个熊猫数据框,看起来像这样。 我想确定猫和蝙蝠是重复的相同值,因此想删除一条记录,只保留第一条记录。所得到的数据帧应该只具有。

  • 下面是数据示例: 我需要将具有相同道具值的重复行删除到另一个数据框,并将它们从原始文件中删除。 所以另一个数据框应该是这样的(重复的行不应该重复): df=df.drop_duplicates()删除一个重复的行,但不是像这样的第二个:

  • 我正在努力去除nans。已经花了一些时间寻找解决方案,但似乎没有任何效果。 下面我附上我的代码样本。整个笔记本可以在我的GitHub这里找到:https://GitHub . com/jarsonX/Temp _ files/blob/main/W3-探索性数据分析(1)。ipynb 我错过了什么? 更新: 我设法过滤掉了南斯: