问题：

在dataframe python中的和列（每行不同的列）[重复]

翁烨霖

2023-03-14

我有一个数据框，有3列a， b， c，如下所示：

df=pd。DataFrame（{'a'：[1,1,5,3]，'b'：[2,0,6,1]，'c'：[4,3,1,4]}）

我想添加列d，它是df中一些列的总和，但不是每行的同一列，例如

只有第1行和第3行是同一列的和，第0行和第2行是其他列的和。

我在Stack over flow上发现的总是整个数据帧的特定列，但在本例中是不同的。

我能做的最好的方法是什么？

共有2个答案

詹高畅

2023-03-14

根据[此解决方案][1]，动态方式使用pd.eval（）。这将分别计算每一行的公式，这允许df['formula']在每一行上不同，并且代码中没有硬编码的内容。这一行中有大量的内容，请参见下面注释中的解释。

df.apply(lambda row: pd.eval(row['formula'], local_dict=row.to_dict()), axis=1)

0    2
1    4
2    5
3    4
#    ^--- this is the result

如果您想将结果分配给数据框列，请说df['z']：

df['z']=df.apply（lambda行：pd.eval（行['formula']，local_dict=row.to_dict（）），axis=1）
或者，您可以使用pd.eval（…，inplace=True），但是公式需要包含实际赋值，例如“z=ab”，并且“z”列需要已经声明：df['z']=np.NaN。这部分实现起来有点烦人，所以我没有

注：

我们使用pd.eval（…）动态评估['formula']列

当我们像这样以行方式调用df.apply（...，轴=1）时，每行都作为一个单独的系列传递进来，因此在我们的应用（...轴=1）中，我们不能再引用数据框为df或其列为df['a']，df['b']，...
因此，我们需要将该行作为Python判决传递，因此在lambda函数中，local_dict=row.to_dict（）参数为pd.eval。

引用：[1]：从变量中的字符串公式计算dataframe列？

公羊浩阔

2023-03-14

因为列d是随机计算的，所以对每行执行此操作的唯一方法是单独计算。

df['d'] = 0
df['d'].iloc[0] = df['b'].iloc[0]
df['d'].iloc[1] = df['a'].iloc[1] + df['c'].iloc[1]
df['d'].iloc[2] = df['a'].iloc[2]
df['d'].iloc[3] = df['a'].iloc[3] + df['c'].iloc[3]

如果是第1行和第3行，则有一个规则：

df['d'].loc[(df.index % 2)==1] = df['a'].iloc[df.index] + df['c'].iloc[df.index]

另外，对于循环：

for i in range(0, 4): 
    if i % 2 == 1: 
        df['d'].iloc[i] = df['a'].iloc[i] + df['c'].iloc[i]

在dataframe python中的和列（每行不同的列）[重复]

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档