当前位置：首页 > 面试题库 >

用另一个数据框的值替换一个数据框的列值

柯乐池

2023-03-14

问题内容：

我有两个数据框，第一个有1000行，看起来像：

Date            Group         Family       Bonus
2011-06-09      tri23_1       Laavin       456
2011-07-09      hsgç_T2       Grendy       679
2011-09-10      bbbj-1Y_jn    Fantol       431
2011-11-02      hsgç_T2       Gondow       569

该列Group具有不同的值，有时会重复，但通常大约有50个唯一值。

第二个数据框包含所有这50个唯一值（50行）以及与这些值关联的酒店：

Group             Hotel
tri23_1           Jamel
hsgç_T2           Frank
bbbj-1Y_jn        Luxy
mlkl_781          Grand Hotel
vchs_94           Vancouver

我的目标是用第二个数据帧的列的相应值替换Group第一个数据帧的列中的值，Hotel或者Hotel用相应的值创建该列。当我尝试通过像

df1.loc[(df1.Group=df2.Group), 'Hotel']=df2.Hotel

我有一个错误，即数据帧的大小不相等，因此无法进行比较

问题答案：

如果将索引设置为另一个df上的“组”列，则可以map在原始df的“组”列上使用替换：

In [36]:
df['Group'] = df['Group'].map(df1.set_index('Group')['Hotel'])
df

Out[36]:
         Date  Group  Family  Bonus
0  2011-06-09  Jamel  Laavin    456
1  2011-07-09  Frank  Grendy    679
2  2011-09-10   Luxy  Fantol    431
3  2011-11-02  Frank  Gondow    569

类似资料：

根据另一个数据框python熊猫替换列值-更好的方法？

问题内容：注意：为简单起见，我使用一个玩具示例，因为复制/粘贴数据帧在堆栈溢出中很困难（请让我知道是否有简便的方法来执行此操作）。有没有一种方法可以将一个数据帧中的值合并到另一个数据帧中而无需获取_X，_Y列？我希望一列中的值替换另一列中的所有零值。在上一篇文章中，我尝试了Combine_First和dropna（），但是这些都做不到。我想用df2中的值替换df1中的零。此外，我希望根据d
根据另一个数据集中的列的值在一个数据框中创建列

我有两个熊猫数据框步骤1：根据df1中唯一的“val”在df2中创建列，如下所示：步骤2：对于flag=1的行，AA_new将计算为var1（来自df2）*组“A”和val“AA”的df1的'cal1'值*组“A”和val“AA”的df1的'cal2'值，类似地，AB_new将计算为var1（来自df2）*组“A”和val“AB”的df1的'cal1'值*组“A”和val“AB”的df1的'c
用另一个数据框的索引创建一个空的数据框

问题内容：我有一个具有多个列和行的数据框 df1 。简单的例子：我想创建一个空的数据框 df2，然后再添加带有计算结果的新列。目前，我的代码如下所示： …添加两个新列：有没有更好/更安全/更快的方法呢？是否可以创建一个空的数据帧df2并仅从df1复制索引？问题答案：这将创建一个没有列但只有一个索引的DataFrame，并且它将与df1中的索引相同。
检查一个数据框中的值是否在另一数据框中

问题内容：我有2个数据框。我想遍历每行，并检查每个名称是否在中。如果名称在其中，结果应返回1，否则返回0：谢谢。问题答案：采用在数据框中显示结果在系列对象中
从基于另一个数据框的值在pyspark数据框中创建列

我有两个pyspark数据帧 DF1 ： df2: 我想向df1添加一个列Location_Id，从df2获取匹配的Id，如下所示: 我如何才能做到这一点？
如何使用另一个数据框中的值使用新列更新数据框？

如何使用Pandas更新/组合/合并数据帧（df1）和来自另一个数据帧（df2）的值，其中df1有一个新列（col3）和来自df2的值。可乐2？换句话说，df1是当前月份的值，我希望df1也有一个来自df2的列，它是上个月的值。任何关于这方面的见解都是值得赞赏的；非常感谢你。 DF1： DF2：所需df：

相关阅读

如何使用来自另一个数据框的新值更新pyspark数据框？将列从一个数据框映射到另一数据框以创建新列 Pandas（Python）-使用条件从另一个更新数据框的列快速删除只有一个不同值的数据框列如何根据最接近的匹配从另一个有效地替换大型数据框（100k +行）中的值？

相关文章

8.29 快手数据挖掘一面 1个小时美的数据开发一面凉数据分析一面实验数据-一面快手数据研发一面（大数据、数仓、数开）

相关问答

Spark-Scala-用另一个数据帧的查找值替换数据帧中的值用另一个数据帧的特定列中的值替换数据帧特定列中的Nan值将列从一个数据框映射到另一个数据框以创建新列[重复]在R中，如何通过另一个数据框的列名删除一个数据框中的行？根据第二个数据框按组创建一个数据框中的日期序列

相关工具

数据库处理框架 One一个解析html网页的数据基于FMDB的数据库操作数据库自动更新及自动赋值工具

相关文档

下一代 Web 框架 Koa 鲜活的数据数据可视化指南 DIY 一个实用的 miniLAPP 服务器数据科学 Python 数据结构