假设我们有熊猫表:
+-------+-------------------+
| Name | Dog |
+-------+-------------------+
| Alice | husky |
| Bob | husky |
| Chris | pom |
| Ferri | malamute |
| Bob2 | corgi |
| Dave2 | corgi |
+-------+-------------------+
我们如何删除只有“狗”一个条目的行?例如,这将是带有pom,雪橇犬的行。
+-------+-------------------+
| Name | Dog |
+-------+-------------------+
| Alice | husky |
| Bob | husky |
| Bob2 | corgi |
| Dave2 | corgi |
+-------+-------------------+
谢谢!
is_multi = df["Dog"].value_counts() > 1
filtered = df[df["Dog"].isin(is_multi[is_multi].index)]
我有一个表,需要删除整个行,其中ID发生第二次和以后的时间,但留下第一次出现suCustoriID顺便说一下。M表的ID是主键,CustometID是重复的。因此,我需要删除所有重复的自定义ID行。 上面的代码将删除所有id,包括每个id的第一次出现,但我需要保留它们的第一次出现。请告知。
我已准备好数据帧 我准备了 我想只覆盖Col2 row0,并尝试以下代码。 但是我得到了一个下面的错误。 索引错误:列表索引超出范围
我有一个熊猫数据框,看起来像这样。 我想确定猫和蝙蝠是重复的相同值,因此想删除一条记录,只保留第一条记录。所得到的数据帧应该只具有。
下面是数据示例: 我需要将具有相同道具值的重复行删除到另一个数据框,并将它们从原始文件中删除。 所以另一个数据框应该是这样的(重复的行不应该重复): df=df.drop_duplicates()删除一个重复的行,但不是像这样的第二个:
我正在努力去除nans。已经花了一些时间寻找解决方案,但似乎没有任何效果。 下面我附上我的代码样本。整个笔记本可以在我的GitHub这里找到:https://GitHub . com/jarsonX/Temp _ files/blob/main/W3-探索性数据分析(1)。ipynb 我错过了什么? 更新: 我设法过滤掉了南斯: