当前位置: 首页 > 面试题库 >

Python:用pandas逐列缩放数字

南门峰
2023-03-14
问题内容

我有一个熊猫数据框’df’,我想在其中逐列执行一些缩放。

  • 在“ a”列中,我需要将最大数设为1,将最小数设为0,并相应地分配所有其他值。
  • 但是,在“ b”列中,我需要 最小值为1最大值为0 ,所有其他值都应相应地分布。

有熊猫函数来执行这两个操作吗?如果没有,numpy肯定会这样做。

    a    b
A   14   103
B   90   107
C   90   110
D   96   114
E   91   114

问题答案:

您可以减去最小值,然后除以最大值(请注意0/0)。请注意,减去最小值后,新的最大值为原始最大值-最小值。

In [11]: df
Out[11]:
    a    b
A  14  103
B  90  107
C  90  110
D  96  114
E  91  114

In [12]: df -= df.min()  # equivalent to df = df - df.min()

In [13]: df /= df.max()  # equivalent to df = df / df.max()

In [14]: df
Out[14]:
          a         b
A  0.000000  0.000000
B  0.926829  0.363636
C  0.926829  0.636364
D  1.000000  1.000000
E  0.939024  1.000000

要切换列的顺序(从1到0,而不是0到1):

In [15]: df['b'] = 1 - df['b']

另一种方法是否定B柱 第一df['b'] = -df['b'])。



 类似资料:
  • 问题内容: 我有一个内存和磁盘受限的环境,我需要解压缩以字符串为基础的块(通过xmlrpc二进制传输)发送给我的gzip文件的内容。但是,使用zlib.decompress()或zlib.decompressobj()/ decompress()都可以在gzip标头上使用barf。我已经尝试过偏移gzip标头(在此处记录),但是仍然没有避免使用barf。gzip库本身似乎仅支持从文件解压缩。 以下

  • 问题内容: 我有一个带有数值的数据框列: 我想查看该列作为箱数: 我如何将结果作为垃圾箱value counts? 问题答案: 你可以使用: 或numpy.searchsorted: …然后value_countsor groupby和合计size: 默认cut返回。 像这样的方法使用所有类别,即使数据中不存在某些类别,也可以使用操作。

  • 问题内容: 我想申请我的自定义函数(它使用的梯)这六个列我的数据帧的每一行中)。 我尝试了与其他问题不同的方法,但似乎仍然找不到适合我问题的正确答案。关键在于,如果该人被视为西班牙裔,就不能被视为其他任何人。即使他们在另一个种族栏中的得分为“ 1”,他们仍然被视为西班牙裔,而不是两个或两个以上的种族。同样,如果所有ERI列的总和大于1,则将它们计为两个或多个种族,并且不能计为唯一的种族(西班牙裔除

  • 问题内容: 我有一个列表列表: 我想将其平均 我的代码好像不太优雅。这是遍历列表的幼稚方法,将总和保存在单独的容器中,然后除以元素数。 我认为有一种Python方式可以做到这一点。有什么建议?谢谢 问题答案: 纯Python: 印刷 NumPy: Python 3:

  • 问题内容: 我需要实现变焦为包含在。我已经通过覆盖方法和调用来成功进行缩放。 这是不正常:对的和的规模如预期,但一定会得到的和这样的寄存器在预分频的位置。我能做什么?感谢您的阅读。 问题答案: 显示了如何使用明确的转化方法扩展鼠标坐标:,,和。)。

  • 问题内容: 我正在尝试使用以下代码在pandas数据框中按索引号删除多列(数据集中的第2列和第70列,分别索引为1和69): 我收到以下错误: 在我的代码中,[1,69]突出显示并说: 下面的代码完成了我希望它成功完成的工作,但是在两行重复的代码上(首先删除col索引69,然后删除1,顺序很重要,因为删除之前的列会更改后面的列的索引)。我以为我可以简单地将多个列索引指定为一个列表,但是上面我可能有

  • 我有一个dataframe,我试图在其中查看“#inc”列,看看是否有数字4。如果有,我想打印整行。我该怎么做? 2月1日0.008307 1-0.030809 1 3月2日0.000000 0-0.027193 2 4月3日0.008845 1-0.035857 1 11月10日0.000000 0-0.148163 2 12月11日0.039241 1-0.024030 1

  • 本文向大家介绍如何使用Python中的scikit-learn库缩放数据?,包括了如何使用Python中的scikit-learn库缩放数据?的使用技巧和注意事项,需要的朋友参考一下 特征缩放是构建机器学习算法的数据预处理阶段的重要步骤。它有助于规范化数据以使其落在特定范围内。 有时,它还有助于提高机器执行计算的速度。 为什么需要它? 作为输入馈入学习算法的数据应保持一致和结构化。输入数据的所有特