我有一个数据框
>>> df
zeroa zerob zeroc zerod zeroe zero
FSi
1 10 100 a ok NaN ok
1 11 110 temp NaN NaN
2 12 120 c temp NaN NaN
3 NaN NaN NaN NaN ok NaN
我只想保留唯一的索引,因为索引1是重复的,我想删除它的第二个实例,我该怎么做?我想要我的结果
>>> df
zeroa zerob zeroc zerod zeroe zero
FSi
1 10 100 a ok NaN ok
2 12 120 c temp NaN NaN
3 NaN NaN NaN NaN ok NaN
好的,像这样的东西应该会有帮助:
df = df.reset_index().drop_duplicates(subset='FSi', keep='first').set_index('FSi')
说明:首先,我们重置了创建列FSi的_索引,因为drop_duplicates作用于列而不是索引。我们保留第一个并将_索引再次设置回FSi
在不重置索引的情况下:
df[~df.index.duplicated()]
我有一个数据帧(df) 我试图删除任何具有相同snap_time索引的行 我试过: 但它没有删除重复的行。 本例的预期输出为:
我有2个数据帧,和,有一个列(和其他非重要的)。 我想在中删除包含已在中的电子邮件的行。 我该怎么做?
我想从熊猫数据框中完全删除重复的项目。例如,我有数据框: 我要做的是在列中查找唯一的值,并删除所有重复的项。。因此,最终产品将如下所示(注意已消失): 谢谢。
问题内容: 我有一个包含多个重复条目的索引。它们具有不同的ID,但其他字段具有相同的内容。 例如: 删除重复项后: 有没有一种方法可以删除所有重复项并仅保留一个不同的条目,而无需手动比较所有条目? 问题答案: 我使用rails,如有必要,我将使用命令导入内容,该命令将删除并重新索引该索引和类型的所有内容……但是不确定您在哪个环境中运行ES。我只能看到的问题是数据源是否您正在从中导入(即数据库)的记
如果我想在数据帧中删除重复的索引,由于明显的原因,以下方法不起作用: 和 查找名为“index”的列 如果我想删除索引,我必须执行以下操作: 有没有更高效的方法?
问题内容: 我需要从数据库中删除重复的行。我可以用简单的SQL查询吗?如果没有,请告诉我一些快速算法。 例子: 我需要删除ID为2的行(或3,无论如何,它们是相等的,但不能同时都是)。谢谢你的帮助 问题答案: 正如评论中指出的那样,如果连续出现三遍,则此操作将无效。您可以重复运行此(繁重的)查询,直到停止删除内容为止,或者等待更好的答案…