当前位置: 首页 > 面试题库 >

如何计算第一和第三四分位数?

衡翰藻
2023-03-14
问题内容

我有DataFrame:

    time_diff   avg_trips
0   0.450000    1.0
1   0.483333    1.0
2   0.500000    1.0
3   0.516667    1.0
4   0.533333    2.0

我想获得该列的第一四分位数,第三四分位数和中位数time_diff。为了获得中位数,我使用np.median(df["time_diff"].values)

如何计算四分位数?


问题答案:

通过使用pandas

df.time_diff.quantile([0.25,0.5,0.75])


Out[793]: 
0.25    0.483333
0.50    0.500000
0.75    0.516667
Name: time_diff, dtype: float64


 类似资料:
  • 目前为止,我们专注于如何创建、解释和执行程序。在第一章中,我们学会使用函数作为组合和抽象的手段。第二章展示了如何使用数据结构和对象来表示和操作数据,以及向我们介绍了数据抽象的概念。在第三章中,我们学到了计算机程序如何解释和执行。结果是,我们理解了如何设计程序,它们在单一处理器上运行。 这一章中,我们跳转到协调多个计算机和处理器的问题。首先,我们会观察分布式系统。它们是互相连接的独立计算机,需要互相

  • 我有一个数据帧: 在不使用Hive的情况下,我希望得到“平均”列的第一个四分位数、第二个四分位数和IQR(四分位数范围)。 其他解决方案似乎使用了每个人都无法访问的蜂箱。 蜂箱解决方案1 蜂箱解决方案2 Python的解决方案

  • 监督学习(Supervised learning) 咱们先来聊几个使用监督学习来解决问题的实例。假如咱们有一个数据集,里面的数据是俄勒冈州波特兰市的 $47$ 套房屋的面积和价格: 居住面积(平方英尺) 价格(千美元) $2104$ $400$ $1600$ $330$ $2400$ $369$ $1416$ $232$ $3000$ $540$ $\vdots$ $\vdots$ 用这些数据来投

  • 第 10 章 算法设计和分析 利用计算机解决问题的关键是设计出合适的算法。对特定问题设计出求解算法,体现了 程序设计这种智力活动的创造性的一面。从事创造性活动需要创造性思维,而不能仅仅依靠 机械的模仿。虽然算法设计并没有一定之规,但计算机科学家总结出了一些行之有效的设计 方法,掌握这些方法对于利用计算机解决问题具有重要意义。利用计算机解决问题,并非只 要设计出正确的算法就行了,还需要分析算法的复杂

  • 4.3.4 第四层设计 先考虑 days 函数的实现。我们将每个月的天数放在列表中,然后通过月份进行索引即 可得到该月天数。要注意有个特殊情形,即闰年 2 月份。这时应当为天数多加 1 天。代码如 下: def days(y,m): month_days = [31,28,31,30,31,30,31,31,30,31,30,31] d = month_days[m] if

  • [1] Chet Ramey 承诺会在Bash的未来版本中实现关联数组(associative arrays) (一个Perl特性). 到了版本3,这个特性还没有实现.