简述
Motivation
一般来说,每个部分的内容数量是较为容易获取的,但比例(百分数)这样的数据是二次数据,这样的操作很常见
比例的信息相比于纯粹的数字更体现的整体体系的内部变化迁移的过程
Contribution
给了实例,follow下就没问题了~
Codes
导入包的部分,我就不写了哈
这里假设每行是属于不同月份的数据
>>> df a b c d e month0 0 1 2 3 4 month1 5 6 7 8 9 month2 10 11 12 13 14 month3 15 16 17 18 19
变百分数
按列(即投影到列)求和
按行(即投影到行)除法
>>> df.div(df.sum(axis=1), axis=0) a b c d e month0 0.000000 0.100000 0.2 0.300000 0.400000 month1 0.142857 0.171429 0.2 0.228571 0.257143 month2 0.166667 0.183333 0.2 0.216667 0.233333 month3 0.176471 0.188235 0.2 0.211765 0.223529
以上这篇Pandas实现DataFrame按行求百分数(比例数)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持小牛知识库。
这5个国家在所有奥运会上获得的奖牌中,每个国家获得的奖牌比例是多少?
问题内容: 规范pandas DataFrame每行的最惯用方法是什么?标准化列很容易,因此一个选项(非常难看!)是: pandas广播规则禁止这样做 问题答案: 要解决广播问题,可以使用以下方法: 参见http://pandas.pydata.org/pandas-docs/stable/basics.html#matching- broadcasting-behavior
问题内容: 我正在处理从H5文件加载的调查数据,就像通过熊猫包一样。在此范围内,所有行都是单个调查的结果,而列则是单个调查中所有问题的答案。 我的目标是将数据集减少到较小的范围,仅包括对某个问题具有特定答案的行,即该列中的所有值均相同。我可以在这种情况下确定所有行的索引值,但是我找不到如何 删除 这些行或仅使用这些行创建新df的方法。 问题答案:
问题内容: 我想在df列中获取特定值的百分比。假设我有一个(fol,col2,col3,性别)的df性别列,其值是M或F。我想获取df中M和F值的百分比。 我已经尝试过了,这给了我M和F实例的数量,但是我想要这些作为df中值总数的百分比。 有人可以帮忙吗? 问题答案: 使用有:
问题内容: 我有这个查询: 它给了我每一行的计数。现在,我想添加第三列,这将给我带来帮助。 我怎样才能做到这一点? 问题答案: 您可以使用子查询来做到这一点: 或带有变量: 在两个示例中,我都将count(*)转换为实数,以避免整数除法类型问题。 希望这对约翰有帮助
问题内容: 我有一个用例,其中: 数据的格式为:Col1,Col2,Col3和时间戳。 现在,我只想获取行数与时间戳箱的数量。 也就是说,对于每半小时的存储桶(甚至没有对应行的存储桶),我需要计算有多少行。 时间戳记分布在一年内,因此我无法将其划分为24个存储桶。 我必须每隔30分钟将它们装箱。 问题答案: 通过