当前位置: 首页 > 面试题库 >

Python:在计数条件下删除行

仲孙雅达
2023-03-14
问题内容

我在过滤pandas数据框时遇到问题。

city 
NYC 
NYC 
NYC 
NYC 
SYD 
SYD 
SEL 
SEL
...

df.city.value_counts()

我想 删除计数频率低于4的城市行, 例如SYD和SEL。

如果不按城市逐个手动删除它们,该怎么办?


问题答案:

在这里,你去过滤器

df.groupby('city').filter(lambda x : len(x)>3)
Out[1743]: 
  city
0  NYC
1  NYC
2  NYC
3  NYC

解决方案二 transform

sub_df = df[df.groupby('city').city.transform('count')>3].copy() 
# add copy for future warning when you need to modify the sub df


 类似资料:
  • 问题内容: 我的df有3栏 我想删除df.col_1为1.0且df.col_2为0.0的行。因此,我会得到: 我试过了: 它给了我错误: 任何想法如何解决上述问题? 问题答案: drop是一种方法,您使用调用它,因此它为您提供了: 更改为(正常方法调用),它应该可以工作: 输出量

  • 我正在建立一个应用程序,并使用MariaDB作为我的数据库。我有一张桌子“kick_votes”。其主键包含三个字段: null

  • 我有一个包含列和的df。我正在尝试仅为每个用户的值行后的值删除重复项 最终df

  • 问题内容: 有没有一种方法可以对 field1 = x* 和 field2 = y的文档执行删除操作 ? *** 我看到了删除功能,但没有附带。如果使用事务,则存在get和delete,但get似乎不接受“ where”子句。 我希望我在文档中缺少一些内容。 谢谢 问题答案: 为此,您需要先创建所需的查询,然后才使用如下方法:

  • 我需要 在Hibernate条件中。由于这个问题,我知道如何将分组结果作为的列表: 我不知道如何添加HAVING子句。我想,它类似于,但是我如何引用计数呢? 有没有办法在查询中引用结果元组元素?

  • 如何从没有主键的表中删除满足几个条件的行?(实际上主键由每一列组成) 经过多次尝试后,我有了一段代码,它首先创建一个临时表,在其中插入我想删除的行,最后我尝试从原始表中删除那些与临时表相比符合条件的行。 但是它给了我一个关于不能链接几个部分标识符#temp.idCarga的错误 也许这很容易,但是我已经尝试了这么多时间,我无法正常集中注意力。