当前位置：首页 > 面试题库 >

熊猫：如何基于多个条件为现有列分配值？

吴兴国

2023-03-14

问题内容：

我想根据以下条件创建一个带有数值的新列：

一种。 if gender is male & pet1=pet2, points = 5

b。 if gender is female & (pet1 is 'cat' or pet1='dog'), points = 5

C。所有其他组合，points = 0

    gender    pet1      pet2
0   male      dog       dog
1   male      cat       cat
2   male      dog       cat
3   female    cat       squirrel
4   female    dog       dog
5   female    squirrel  cat
6   squirrel  dog       cat

我希望最终结果如下：

    gender    pet1      pet2      points
0   male      dog       dog       5
1   male      cat       cat       5
2   male      dog       cat       0
3   female    cat       squirrel  5
4   female    dog       dog       5
5   female    squirrel  cat       0
6   squirrel  dog       cat       0

我该怎么做？

问题答案：

为此，可以使用做np.where，条件使用位&和|用于and和or与周围的多个条件括号由于运算符优先级。因此，5返回条件为true的地方，0否则返回：

In [29]:
df['points'] = np.where( ( (df['gender'] == 'male') & (df['pet1'] == df['pet2'] ) ) | ( (df['gender'] == 'female') & (df['pet1'].isin(['cat','dog'] ) ) ), 5, 0)
df

Out[29]:
     gender      pet1      pet2  points
0      male       dog       dog       5
1      male       cat       cat       5
2      male       dog       cat       0
3    female       cat  squirrel       5
4    female       dog       dog       5
5    female  squirrel       cat       0
6  squirrel       dog       cat       0

类似资料：

基于多条件熊猫的输出逻辑序列

我想基于多个条件的评估创建一系列新的逻辑值。举个例子然而，我想返回一个逻辑序列，即。如果可能的话，我想用熊猫的方法。
熊猫python COUNTIF在具有多个条件的多个列上

问题内容：我有一个数据集，其中我试图确定每个人的危险因素数量。所以我有以下数据：每个属性（年龄，吸烟者，糖尿病）都有自己的条件来确定是否是危险因素。因此，如果年龄> = 45，则是一个危险因素。吸烟者和糖尿病为“ Y”是危险因素。我想要添加一列，以根据这些条件总计每个人的风险因素数量。因此数据如下所示：我有一个样本数据集，我在Excel中鬼混，而我这样做的方式是使用COUNTIF公式，如下所
熊猫：过滤多个条件

问题内容：我正在尝试使用Pandas在几个条件下进行布尔索引。我原来的DataFrame称为。如果执行以下操作，将得到预期的结果：但是，如果我这样做（我认为应该是等效的），则不会返回任何行：知道导致差异的原因是什么？问题答案：使用是因为运算符优先级：或者，在单独的行上创建条件：样品：
pyspark将一列拆分为多个列而没有熊猫

我的问题是如何将一列拆分为多个列。我不知道为什么不起作用。例如，我想将“df_test”更改为“df_test2”。我看到了很多使用熊猫模块的例子。还有别的办法吗？提前感谢您。 df_test2
根据熊猫中的多个条件分组[重复]

我想对两列使用不同的条件来聚合行。当我做，我得到输出1 当我做时，我得到输出2 是否有一种方法可以进行聚合，将输出1显示到，将输出2显示到？
以有效的方式附加基于多种条件的熊猫数据帧列（python）

我有一个如下所示的数据框，我必须准备“目标列” 如果同一列下的两个单词之间有逗号，则必须按第2行所示标记两次。如果没有逗号但有空格，则必须将其视为同一个单词，即必须标记一次。另外，请注意顺序也很重要（第3行和第6行）。忽略任何内容（即没有单词，因此没有标签）我已经使用了迭代（即使用iloc，for循环），但是它需要大量的时间，因为数据点超过200k，标签的数量也超过20个。我希望有一个有效的代码

相关阅读

如何在熊猫中实现具有多个列的布尔搜索如何在熊猫中使用基于DataFrame布尔值的条件语句在熊猫中分配线条颜色多列熊猫get_dummies 如何基于列表中的值更新/创建熊猫中的列

相关文章

基于订单系统的分库分表实战 Spring基于XML实现事务管理分析发现文件一个基于分布式锁的库存高并发超卖问题如何使用gcc指令一次处理多个文件？

相关问答

熊猫：为多个列添加数字熊猫：索引数据帧时出现多个条件-意外行为熊猫-获取行匹配条件[重复]的列值熊猫的数学运算，以列值为条件熊猫：如何将一列中的文本拆分为多行？

相关工具

熊猫Flash播放器基于BeeFramework的表格控件仿天猫App可打开列表基于cocos2d-x的对对碰基于cocos2d的连连看游戏

相关文档

Duang 基于配置自动生成 CMS 变现猫接入文档 v1.4 Knative入门构建基于 Kubernetes 的现代化 Serverless 应用深度学习入门：基于 Python 的理论与实现基于 Node.js 的 HTTPS MITM 中间人代理的原理和实现