问题：

如何将函数应用于Pandas数据帧的两列

诸葛嘉熙

2023-03-14

df['col_3'] = df[['col_1','col_2']].apply(f)  
# Pandas gives : TypeError: ('<lambda>() takes exactly 2 arguments (1 given)'

怎么办？

**添加详细示例如下***

import pandas as pd

df = pd.DataFrame({'ID':['1','2','3'], 'col_1': [0,2,3], 'col_2':[1,4,5]})
mylist = ['a','b','c','d','e','f']

def get_sublist(sta,end):
    return mylist[sta:end+1]

#df['col_3'] = df[['col_1','col_2']].apply(get_sublist,axis=1)
# expect above to output df as below 

  ID  col_1  col_2            col_3
0  1      0      1       ['a', 'b']
1  2      2      4  ['c', 'd', 'e']
2  3      3      5  ['d', 'e', 'f']

共有1个答案

钮实

2023-03-14

下面是一个在dataframe上使用apply的示例，我正在使用axis=1调用dataframe。

注意不同之处在于，不是尝试向函数f传递两个值，而是重写函数以接受一个pandas系列对象，然后索引该系列以获得所需的值。

In [49]: df
Out[49]: 
          0         1
0  1.000000  0.000000
1 -0.494375  0.570994
2  1.000000  0.000000
3  1.876360 -0.229738
4  1.000000  0.000000

In [50]: def f(x):    
   ....:  return x[0] + x[1]  
   ....:  

In [51]: df.apply(f, axis=1) #passes a Series object, row-wise
Out[51]: 
0    1.000000
1    0.076619
2    1.000000
3    1.646622
4    1.000000

根据您的用例，创建pandasgroup对象，然后在组上使用apply有时会很有帮助。

类似资料：

Python-如何将函数应用于Pandas数据框的两列

问题内容：假设我有一个df包含的列。我定义一个函数：现在，我要应用f到df的两列，以逐元素的计算新列，有点像：怎么做？如下添加详细样本 * 问题答案：这是apply在数据框上使用的示例，我正在用进行调用。请注意，区别在于，与其尝试将两个值传递给该函数f，不如重写该函数以接受pandas Series对象，然后对Series进行索引以获取所需的值。根据你的用例，有时创建一个对象然后在
将函数应用于数据帧的列列表？

我从这个URL刮取了这个表： "https://www.patriotsoftware.com/blog/accounting/average-cost-living-by-state/" 看起来像这样：然后我编写了这个函数来帮助我将字符串转换成整数：当我只将函数应用于一列时，它就会工作。我在这里找到了关于在多个列上使用的答案：如何将函数应用于多个列但我下面的代码不起作用，也不会产生错误：
将函数按行应用于数据帧

我必须从二维坐标计算希尔伯特曲线上的距离。使用hilbertcurve包，我构建了自己的“hilbert”函数。坐标存储在数据帧（列1和列2）中。如您所见，我的函数在应用于两个值（test）时有效。然而，它只是不工作时，应用行明智通过应用函数！这是为什么呢？我到底做错了什么？我需要一个额外的列“希尔伯特”，希尔伯特距离在列“col_1”和“col_2”中给出。最后一个命令以错误结束：谢谢你的
将函数应用于火花数据帧列

并将其应用于数据表的一列--这是我希望这样做的：我还没有找到任何简单的方法，正在努力找出如何做到这一点。一定有一个更简单的方法，比将数据rame转换为和RDD，然后从RDD中选择行来获得正确的字段，并将函数映射到所有的值，是吗？创建一个SQL表，然后用一个sparkSQL UDF来完成这个任务，这更简洁吗？
Pandas error:ValueError：序列的真值不明确。关于将函数应用于数据帧

我有一个数据帧，在对其应用函数时给出值错误。 ValueError：序列的真值不明确。使用a.empty、a.bool（）、a.item（）、a.any（）或a.all（）。
python pandas-将具有两个参数的函数应用于列

问题内容：您可以使用两个不同的列中的值作为参数来制作python pandas函数吗？我有一个函数，如果两列的值在相同范围内，则返回1。否则返回0：我希望第一个参数成为数据框中的一列，以使函数将采用该列中每一行的值。例如是，第二个参数是df [‘ResponseCol’]`。我希望结果是数据框中的新列。我遇到了几个回答了类似问题的线程，但看起来这些参数是变量，而不是数据帧行中的值。我尝试

如何将函数应用于Pandas数据帧的两列

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档