当前位置: 首页 > 知识库问答 >
问题:

在Pandas中,如何对特定的连续列进行一些算术计算

丁雅惠
2023-03-14

在下面的代码中,我喜欢只在代码为'b'时计算值的总百分比变化。 预期的答案是0.6(即3/4*8/10)。

import pandas as pd
import numpy as np
x = pd.DataFrame({'Code':['a', 'a', 'a', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b', 'a', 'a'], 'Value': np.arange(13)})

   Code  Value
0     a      0
1     a      1
2     a      2
3     b      3
4     b      4
5     a      5
6     a      6
7     a      7
8     b      8
9     b      9
10    b     10
11    a     11
12    a     12

我尝试使用df.groupby,但是由于有两组'b',它没有达到我所期望的效果。

非常感谢您提前抽出时间。

共有1个答案

任长卿
2023-03-14

然后从pct_change中取任何您想要的值,并按您的意愿将它们相乘。

pct_change = df.loc[df['Code'] == 'b'].pct_change()
 类似资料:
  • 我想用熊猫数某列的行数。我有这样的DataFrame: 我想计算列B中的行数,我的代码如下: 但是不管什么我都会把它放在最长列的行号上。 我应该在代码中更改什么来获得列B的行数o,但没有空行?

  • 问题内容: 我在DataFrame中有一列带有值: 如何将它们这样分组? 问题答案: 你可以groupby通过自定义使用:

  • 问题内容: 我有一个数据帧,有三列:,和; 计数是浮点数,日期是2015年的连续几天。 我试图找出和列中每一天的计数之间的差异,这意味着,我试图计算这两列的每一行与上一行之间的差异。我已经将日期设置为索引,但是却很难弄清楚该如何做。关于使用有一些提示,但是我没有运气找到合适的答案或说明。 我有点受阻,不胜感激这里的一些指导。 这是我的数据框的样子: 问题答案: 应该给出期望的结果:

  • 问题内容: 我有一个熊猫数据框如下 上面的数据帧有83000行。我想获取两个连续行之间的时间差,并将其保存在单独的列中。理想的结果是 我已经尝试过但出现错误,如下所示 如何解决这个问题 问题答案: 问题是功能需要s或s ,因此首先要转换为,然后得到并除以: 如果需要或每分钟:

  • 我必须为图像中的所有像素添加一些常量值 - 对于灰色图像和彩色图像。但我不知道我该怎么做。我通过BufferedImage阅读图像,并且我正在尝试获取2d像素数组。我发现了类似BufferedImage.getRGB()的东西,但它返回奇怪的值(负值和巨大值)。如何为我的缓冲图像添加一些价值?

  • 问题内容: 假设我在Oracle数据库中有一个表,如下表(table_1)所示,该表跟踪特定个人的服务参与情况: 我的目标是获得一个汇总表,该表针对所有唯一的个人列出是否涉及服务,以及不同的服务事件数量(在这种情况下,帐单为2,可疑为3),其中由几天内中断活动。 要参与 任何 服务,我将使用以下查询 但是,我对如何获得服务参与数感到困惑(2)。在R中使用静态数据帧,您将使用游程长度编码(请参阅我的

  • 问题内容: 所以,我有一张表,上面有这样的行: 每次扫描警报时(即每次触发或清除警报时)都会添加“已扫描的警报”行。任何警报都会添加带有特定Ev_Custom1的行。第一列Ev_Message包含一个计算机ID,该ID使我可以将警报与其他计算机分开。(您不喜欢任意的列名吗?)超过900条独特的警报消息。 我希望查询返回的内容是这样的: 这将是两个日期之间过滤的查询。我可以更改进入表的数据,但是有9

  • 问题内容: 假设我们有以下pandas DataFrame: 如何以 向量化的方式计算 大熊猫的连续数量?我想要这样的结果: 类似于矢量化求和运算的操作,它会在特定条件下重置。 问题答案: 您可以执行以下操作(贷方:如何使用系列/数据框模拟itertools.groupby):