在python数据分析中,有时需要根据多列数据生成中间结果,pandas给我们带来了很多方便,通常简短的代码可以实现一些高级功能,灵活掌握一些技巧可以事倍功半
pandas的apply方法用于对指定列的每个元素进行相同的操作,下面生成一个dataFrame用于演示:
import pandas as pd a=range(5) b=range(5,10) c=range(10,15) data=pd.DataFrame([a,b,c]).T data.columns=["a","b","c"] print(data)
上面的代码生成的数据如下:
a b c
0 0 5 10
1 1 6 11
2 2 7 12
3 3 8 13
4 4 9 14
下面使用使用a,b两列相加生成x1列
data["x1"]=data[["a","b"]].apply(lambda x:x["a"]+x["b"],axis=1)
结果如下:
a b c x1
0 0 5 10 5
1 1 6 11 7
2 2 7 12 9
3 3 8 13 11
4 4 9 14 13
关键的参数是axis=1,指定计算的方向是行而不是列,默认是0,也就是按列进行计算
到此这篇关于pandas apply使用多列计算生成新的列实现示例的文章就介绍到这了,更多相关pandas apply多列计算生成新的列内容请搜索小牛知识库以前的文章或继续浏览下面的相关文章希望大家以后多多支持小牛知识库!
本文向大家介绍pandas使用apply多列生成一列数据的实例,包括了pandas使用apply多列生成一列数据的实例的使用技巧和注意事项,需要的朋友参考一下 如下所示: 以上这篇pandas使用apply多列生成一列数据的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持呐喊教程。
问题内容: 我想编写一些测试来分析python中不同操作的效率,即字典理解和dict生成器的比较。 为了验证这一点,我想我会尝试一个简单的示例:使用字典计算列表中的单词数。 现在,我知道您可以使用(按照这里的答案:如何计算Python中列表项的出现?)进行此操作,但是我的目标是测试内存性能。 一种“长手”方法是在基本循环中进行操作。 结果: 然后我在字典理解中尝试执行相同操作时有点卡住: 我收到一
问题内容: 蟒蛇 我有一个清单清单。喜欢 我想计算每个列表在主列表中出现了多少次。 我的输出应该像 问题答案: 只需使用来自:
例如,假设我有一个 我有条件: 我如何测试条件并为我的df的每一行返回一个结果,如下面所示? 编辑:理想情况下,我想创建一个,允许我 并计算所有行的数据。因为在实际数据中,有100个条件语句和10个列。
本文向大家介绍python列表生成式与列表生成器的使用,包括了python列表生成式与列表生成器的使用的使用技巧和注意事项,需要的朋友参考一下 列表生成式:会将所有的结果全部计算出来,把结果存放到内存中,如果列表中数据比较多,就会占用过多的内存空间,可能会导致MemoryError内存错误或者导致程序在运行时出现卡顿的情况 列表生成器:会创建一个列表生成器对象,不会一次性的把所有结果都计算出来,如
本文向大家介绍java实现的AES秘钥生成算法示例,包括了java实现的AES秘钥生成算法示例的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了java实现的AES秘钥生成算法。分享给大家供大家参考,具体如下: PS:关于加密解密感兴趣的朋友还可以参考本站在线工具: 密码安全性在线检测: http://tools.jb51.net/password/my_password_safe 高强度密