当前位置: 首页 > 面试题库 >

Python Pandas计数和求和特定条件

傅明知
2023-03-14
问题内容

大熊猫中是否有单个函数来执行SUMIF的等价功能(对特定条件求和)和COUNTIF(对Excel中的特定条件的值进行计数)?

我知道有许多多步功能可用于

例如sumif我可以使用(df.map(lambda x: condition), or df.size())然后使用.sum()

因为countif我可以使用(groupby functions并寻找答案,或者使用过滤器和.count())

在输入条件和数据框并获得总和或计数结果时,是否有简单的一步过程即可完成这些功能?


问题答案:

您可以先进行条件选择,然后使用该sum函数汇总选择的结果。

>> df = pd.DataFrame({'a': [1, 2, 3]})
>> df[df.a > 1].sum()   
a    5
dtype: int64

有多个条件:

>> df[(df.a > 1) & (df.a < 3)].sum()
a    2
dtype: int64


 类似资料:
  • 问题内容: 我正在尝试计算在一块土地上灌溉的总水量。我所拥有的是记录在SQL数据库中的瞬时流量变化。-以立方米/小时为单位。 根本不能将这些值相加并假定是灌溉的总水量。 需要做的是计算每个时间戳的时差,并计算该持续时间的音量,然后在用户选择的小时数内进行计算。 因此对于上述数据,时间差为(第一个小时) 该小时(从凌晨4点到凌晨5点)的总灌溉量为:373811.6立方米的水除以3600 = 103.

  • 问题内容: 我有显示客户来电的数据。我有客户编号,电话号码(1个客户可以有多个),每个语音呼叫的日期记录和呼叫持续时间的列。表看起来在下面的例子中。 我想要的是在应答之前(持续时间> 0)计算每个号码的呼叫尝试次数。这样我就可以估算出平均应该致电多少次才能联系到客户或电话号码。它基本上应该计算持续时间> 0的min(Date)之前每个电话号码的任何列。 我认为这应该给我时间限制,直到我应该计算通话

  • 本文向大家介绍符合Python中特定条件的元素计数,包括了符合Python中特定条件的元素计数的使用技巧和注意事项,需要的朋友参考一下 在本文中,我们将看到如何从Python列表中获取一些选定的元素。因此,我们需要设计一些条件,并且仅应选择满足该条件的元素并打印其计数。 求和 在这种方法中,我们有条件地选择元素并使用一些元素来获取它们的数量。如果元素存在,则使用1;否则,条件条件的结果使用0。 示

  • 问题内容: 我只想选择特定的列(例如)。我有一个通用的DAO,我想到的是: 错误是: 。我应该如何改变呢?我想获取一个类型对象,该对象仅具有和字段,而其他所有对象都是。 类型扩展有两个字段。 是。 问题答案: 仅获取特定列的JPA方法之一是请求一个Tuple对象。 在您的情况下,您需要编写如下内容: 如果您有一个代表结果的类(例如您的情况),则可以采用另一种方法。不必是Entity类。如果具有类似

  • 我尝试使用曲线拟合来定义以下形式的函数: 我想计算参数Rth和tau的第一个四个值。目前,它的作品罚款如果我使用整个功能像这样: 但这肯定不是一个好方法,例如,如果我有一个包含4个以上指数项的很长的函数,我想得到所有的参数。如何调整它,使其在曲线拟合后返回特定数量的Rth和tau值? 例如,如果我想从一个8项指数函数中得到16个参数,我不需要写完整的8项,只需要写一个一般形式,它就会给出所需的输出

  • 问题内容: 我正在使用.ajaxStart()和.ajaxStop()在提出ajax请求时显示模式。(在开始和停止之间) 现在,我想添加一个longpoll函数,该函数一直等待通知,类似于本网站左上角的通知。 我的问题现在在于仅针对longpolling请求禁用此模式。 在处理程序上注册“加载屏幕”: 我的longpoll函数: 我试过了: ..并在开始轮询后重新连接处理程序,但没有任何乐趣。 我