当前位置: 首页 > 编程笔记 >

Pandas实现DataFrame按行求百分数(比例数)

强安和
2023-03-14
本文向大家介绍Pandas实现DataFrame按行求百分数(比例数),包括了Pandas实现DataFrame按行求百分数(比例数)的使用技巧和注意事项,需要的朋友参考一下

简述

Motivation

一般来说,每个部分的内容数量是较为容易获取的,但比例(百分数)这样的数据是二次数据,这样的操作很常见

比例的信息相比于纯粹的数字更体现的整体体系的内部变化迁移的过程

Contribution

给了实例,follow下就没问题了~

Codes

导入包的部分,我就不写了哈

这里假设每行是属于不同月份的数据

>>> df
     a  b  c  d  e
month0  0  1  2  3  4
month1  5  6  7  8  9
month2 10 11 12 13 14
month3 15 16 17 18 19

变百分数

按列(即投影到列)求和

按行(即投影到行)除法

>>> df.div(df.sum(axis=1), axis=0)
        a     b  c     d     e
month0 0.000000 0.100000 0.2 0.300000 0.400000
month1 0.142857 0.171429 0.2 0.228571 0.257143
month2 0.166667 0.183333 0.2 0.216667 0.233333
month3 0.176471 0.188235 0.2 0.211765 0.223529

以上这篇Pandas实现DataFrame按行求百分数(比例数)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持小牛知识库。

 类似资料:
  • 这5个国家在所有奥运会上获得的奖牌中,每个国家获得的奖牌比例是多少?

  • 问题内容: 规范pandas DataFrame每行的最惯用方法是什么?标准化列很容易,因此一个选项(非常难看!)是: pandas广播规则禁止这样做 问题答案: 要解决广播问题,可以使用以下方法: 参见http://pandas.pydata.org/pandas-docs/stable/basics.html#matching- broadcasting-behavior

  • 问题内容: 我正在处理从H5文件加载的调查数据,就像通过熊猫包一样。在此范围内,所有行都是单个调查的结果,而列则是单个调查中所有问题的答案。 我的目标是将数据集减少到较小的范围,仅包括对某个问题具有特定答案的行,即该列中的所有值均相同。我可以在这种情况下确定所有行的索引值,但是我找不到如何 删除 这些行或仅使用这些行创建新df的方法。 问题答案:

  • 问题内容: 我想在df列中获取特定值的百分比。假设我有一个(fol,col2,col3,性别)的df性别列,其值是M或F。我想获取df中M和F值的百分比。 我已经尝试过了,这给了我M和F实例的数量,但是我想要这些作为df中值总数的百分比。 有人可以帮忙吗? 问题答案: 使用有:

  • 问题内容: 我有这个查询: 它给了我每一行的计数。现在,我想添加第三列,这将给我带来帮助。 我怎样才能做到这一点? 问题答案: 您可以使用子查询来做到这一点: 或带有变量: 在两个示例中,我都将count(*)转换为实数,以避免整数除法类型问题。 希望这对约翰有帮助

  • 问题内容: 这显然很简单,但是作为一个笨拙的新手,我陷入了困境。 我有一个包含3列的CSV文件,分别是该办公室的州,办公室ID和销售。 我想计算给定状态下每个办公室的销售百分比(每个州的所有百分比的总和为100%)。 返回: 我似乎无法弄清楚如何“高达”的水平与总起来对整个计算分数。 问题答案: 你将不得不创建第二个对象,但是你可以以一种更简单的方式来计算百分比-仅计算并将该列除以其和即可。复制P