我的熊猫数据框中有2列。
cola colb
X X
C NaN
NaN R
X X
我想去掉可乐和可乐,用可乐代替。
cola colb colc
X X X
C NaN C
NaN R R
X X X
基本上,我需要用cola和colb中的值填充colc。如果可乐中有一个楠,那么它会从可乐中拉出,如果可乐中有一个楠,它会从可乐中拉出。如果可乐和可乐中没有楠,它们应该总是相等的。
我将如何在熊猫身上实现这一点?
或者,使用np。其中
要创建逻辑条件以填充阵列,请执行以下操作:
df["colc"] = np.where(df["cola"].notna(),df["cola"],df["colb"])
df["colc"] = df["cola"].fillna(df["colb"])
根据和的公共列在中使用填充列的最佳方法是什么? 得到: 编辑:我还想将列名更改为,这样预期的输出如下所示: 尝试过: 它发现了错误: 更新2: : :
问题内容: 我在Pandas DataFrame中有一列具有连续数字的列。 我想将所有这些值更改为一个简单的字符串,例如“ foo”,导致 问题答案: 只需选择该列并像往常一样分配: 分配标量值会将所有行设置为相同的标量值
并希望按列表中的值更改行C1-C3。预期产出:
我需要你帮忙整理桌子。我增加了两个新栏。我想用另一列(col1)的数据填充这些列(col2、col3)。目前,此列包含两个以“val1;val2”分隔的值。 col1包含一个字符串,但有时val1不存在,col1只包含“;val2” null 我不知道如何在SQL Server管理中直接做到这一点。我想创建一个脚本来执行这段代码。
有一个由一个人和订单组成的数据帧... 我想知道顾客的主食是什么。因此,我想添加另一列[main_-mean],这将是我的df。 规则是,如果一个顾客点了4份或更多的餐,这意味着第4个元素永远是主菜,所以我想从订单栏上的列表中提取第4个元素。如果它包含少于4个元素,则将main_meal分配给无。我的代码: 它不起作用: 我的代码有什么问题?
我有一个熊猫数据框,它有超过4列。col1中的某些值缺失,我希望根据以下方法设置这些缺失的值: 尝试根据具有相同col2, col3, col4值的记录的col1值的平均值来设置它 如果没有这样的记录,则根据具有相同col2, col3值的记录的col1值的平均值来设置它 如果仍然没有这样的记录,则根据具有相同col2值的记录的col1值的平均值来设置它 如果以上都找不到,将其设置为col1中所有