当前位置: 首页 > 面试题库 >

试图在python中创建分组变量

彭海阳
2023-03-14
问题内容

我有一列年龄值,我需要将其转换为18-29、30-39、40-49、50-59、60-69和70+以上的年龄范围:

对于df“文件”中某些数据的示例,我有:

在此处输入图片说明

并希望到达:

在此处输入图片说明

我尝试了以下方法:

file['agerange'] = file[['age']].apply(lambda x: "18-29" if (x[0] > 16
                                       or x[0] < 30) else "other")

我宁愿不只是进行分组,因为存储桶的大小不是统一的,但如果可行的话,我会对此开放。

提前致谢!


问题答案:

看来您正在使用Pandas库。它们包括执行此操作的功能:http : //pandas.pydata.org/pandas-
docs/version/0.16.0/genic/pandas.cut.html

这是我的尝试:

import pandas as pd

ages = pd.DataFrame([81, 42, 18, 55, 23, 35], columns=['age'])

bins = [18, 30, 40, 50, 60, 70, 120]
labels = ['18-29', '30-39', '40-49', '50-59', '60-69', '70+']
ages['agerange'] = pd.cut(ages.age, bins, labels = labels,include_lowest = True)

print(ages)

   age agerange
0   81      70+
1   42    40-49
2   18    18-29
3   55    50-59
4   23    18-29
5   35    30-39


 类似资料:
  • 问题内容: 我试图在这里一次正常地问一个问题,但是没人知道我想问什么。因此,我在PHP中找到了示例。 PYTHON中有没有像extract()这样的函数? 因此,字典也是如此: ps为什么我要这样做:当您处于类方法中时,当string为self.data [‘raw’] [‘code’]时,很难对join()和format()中的字符串进行6种操作(假设这是这里的字典) 问题答案: 好的php兄弟

  • 我想知道你能在MySQL中创建一个数组变量吗?我知道你可以创建一个普通变量,比如so

  • 问题内容: 我正在尝试使用python中的pandas从类别变量中创建一系列虚拟变量。我遇到过该函数,但是每当我尝试调用该函数时,都会收到一个错误,提示您未定义名称。 创建虚拟变量的任何想法或其他方式将不胜感激。 编辑 :由于其他人似乎遇到了这种情况,因此熊猫中的函数现在可以正常工作了。这意味着以下应该起作用: 有关更多信息,请参见http://blog.yhathq.com/posts/logi

  • 我试图在python中使用pandas从一个分类变量创建一系列伪变量。我遇到了函数,但每当我尝试调用它时,都会收到一个错误,即名称未定义。 任何创建虚拟变量的想法或其他方法都将受到欢迎。 编辑:由于其他人似乎遇到了这种情况,熊猫中的功能现在运行得非常好。这意味着以下各项应起作用: 看见http://blog.yhathq.com/posts/logistic-regression-and-pyth

  • 问题内容: 我有一个名为Variable的类,其定义如下: 我想创建26个Variable的大写单字母实例,如下所示: 到目前为止,我已经尝试了各种解决方案,而我想出的最好的解决方案是: 但是,这无法运行,并给我这个错误: 我究竟做错了什么? 问题答案: from string import uppercase _g = globals() for char in uppercase: _g[ch

  • 我想通过API(appscript)在Google工作表中实现组,因为direct方法不能动态工作。我有一个名为levels(0-8)的列,然后还有两个列(其他信息)。我想写一个脚本来组成小组。它将检查具有级别的第一列,如果下一行的级别高于当前i级别,它将生成一组这些行,直到出现具有相同级别或低于i级别的行。例如,级别为:1,2,3,4,1,0,3,4。在这种情况下,它将从1开始,并将2,3,4作