我需要合并两个不同大小的数据帧。较大的一个(DF1
)有一列有几个重复的值(Licto
),较短的一个(DF2
)有列Licto
,但其值不重复。df2还有一个ID列。我需要在DF1
中使用DF2
中的ID的新列,根据Licto
中的重复值重复。下面的例子可能会让它更清楚。
df1<-data.frame(licfrom=c(15470,16307,17121,15350,16982,17182,20319,16727,16946,16262,16605,
16607,15924,15399,15404,16739,16839,16842,16899,16157,15399),
licto=c(17121,17121,17121,16982,16982,16982,16982,16946,16946,16262,16607,
16607,15924,16839,16839,16839,16839,16839,16839,16157,15399))
.
df2<-data.frame(licto=c(17121,16982,16946,16607,15924,16839,16157,15399),
fisherID=c(160,760,770,406,106,2196,17323,2441))
df1 df2
licfrom licto licto fisherID
15470 17121 17121 160
16307 17121 16982 760
17121 17121 16946 770
15350 16982 16262 947
16982 16982 16607 406
17182 16982 15924 106
20319 16982 16839 2196
16727 16946 16157 17323
16946 16946 15399 2441
16262 16262
16605 16607
16607 16607
15924 15924
15399 16839
15404 16839
16739 16839
16839 16839
16842 16839
16899 16839
16157 16157
15399 15399
licfrom licto fisherID
15470 17121 160
16307 17121 160
17121 17121 160
15350 16982 760
16982 16982 760
17182 16982 760
20319 16982 760
16727 16946 770
16946 16946 770
16262 16262 947
16605 16607 406
16607 16607 406
15924 15924 106
15399 16839 2196
15404 16839 2196
16739 16839 2196
16839 16839 2196
16842 16839 2196
16899 16839 2196
16157 16157 17323
15399 15399 2441
只需使用函数merge()
即可。
merge(df1,df2,sort=FALSE)
licto licfrom fisherID
1 17121 15470 160
2 17121 17121 160
3 17121 16307 160
4 16982 15350 760
5 16982 16982 760
6 16982 20319 760
7 16982 17182 760
8 16946 16727 770
9 16946 16946 770
10 16607 16605 406
11 16607 16607 406
12 15924 15924 106
13 16839 15399 2196
14 16839 15404 2196
15 16839 16739 2196
16 16839 16839 2196
17 16839 16842 2196
18 16839 16899 2196
19 16157 16157 17323
20 15399 15399 2441
我有两个不同列数和行数的CSV文件。第一个CSV文件有M列和N行,第二个文件有H列和G行。一些列具有相同的名称。 null 另外,如果两个CSV文件有两个数据帧,并希望这样做,例如,如果我将第一个CSV加载到中,将第二个加载到中,然后希望合并到,类似于上面的示例。
我有两个csv文件,我想读入熊猫的数据帧。我想合并它们,但显示时间不能重复。 如果ShowingDateTime是重复的,我想从第一个数据帧而不是第二个数据帧中选择行。我不确定用熊猫做这件事的最好方法。我想排序基于升序ShowingDateTime之后。 CSV1: CSV2: 预期合并结果(在df合并后写入csv):
我有两个数据帧: df1-是一个透视表,它包含列和行的总数,两者都具有默认名称“全部”df2-我通过指定值并使用与上面透视表中使用的相同的索引和列名手动创建的df。本表没有总数。 我需要将第一个数据帧乘以第二个数据帧中的值。我希望总数返回NaN,因为总数不存在于第二个表中。 当我执行乘法运算时,我得到以下错误:
我有2个不同大小的数据帧df1-df2(df2比df1有更多的行和列)。 我试图分配的值从df2['率']到df1['率'],在其中df1['单元']==df2['单元']行。 期望的输出是 我尝试了不同的方法: 只能比较相同标记的Series对象 给我假消息 我认为这来自于这样一个事实,即两个数据帧从一开始就有不同的大小。然而,我不明白为什么它应该阻止它做比较。我不确定如何从这里开始。
我有一个包含18个数据帧的列表: 所有数据帧都有一个公共id列,因此很容易将它们与pd连接在一起。一次合并2个。有没有一种方法可以一次将它们连接起来,从而使dfList作为单个数据帧返回?
我有两个不同的DataFrames,我想合并与和列。我看到有一些线程,但我找不到我的问题的解决方案。我也读了这份文件,并尝试了不同的组合,但是,不工作得很好。 我的两个不同数据帧的示例, 正如您在两个数据帧中看到的,以开始,我想加入,这基本上是匹配的日期和时间。到目前为止,我使用前面的线程和上面提到的文档尝试了许多不同的组合。例如,, 这是右DataFrame的值。我知道,我不必同时使用和列,但是