我有两个pandas
数据框,a
和b
:
a1 a2 a3 a4 a5 a6 a7
1 3 4 5 3 4 5
0 2 0 3 0 2 1
2 5 6 5 2 1 2
和
b1 b2 b3 b4 b5 b6 b7
3 5 4 5 1 4 3
0 1 2 3 0 0 2
2 2 1 5 2 6 5
这两个数据帧包含完全相同的数据,但顺序不同且列名不同。基于这两个数据帧的数字,我希望能够将每个列名在匹配a
到每个列名b
。
很难简单地将的第一行a
与的第一行进行比较,b
因为存在重复的值(例如两者都具有a4
且a7
具有值),5
因此不可能立即将它们与b2
或匹配b4
。
做这个的最好方式是什么?
这是一种利用广播检查两个数据帧之间是否相等并all
利用结果检查所有行匹配的一种方法。然后,我们可以从np.where
(带有@piR的贡献)的结果中获得两个数据框的列名称的索引数组:
i, j = np.where((a.values[:,None] == b.values[:,:,None]).all(axis=0))
dict(zip(a.columns[j], b.columns[i]))
# {'a7': 'b2', 'a6': 'b3', 'a4': 'b4', 'a2': 'b7'}
问题内容: 我需要在两个(或更多个)组合框之间共享数据,但是我想独立选择元素。例如,如果我在第一个comboBox中选择Object1,则我的第二个ComboBox也选择Object1,因为它们具有相同的模型(DefaultComboBoxModel,并且此模型还管理所选的对象)。但是我不想要这种行为。我想在我的comboBoxes中独立选择对象。当我在第一个comboBox中选择对象时,我的第二
问题内容: 我有一个数据框df: 我想找到的Pearson相关系数的值,并为每 因此结果应如下所示: 更新: 必须确保变量的所有列均为或 问题答案: 输出: 具有OP输出格式。 输出:
问题内容: 关闭。 这个问题是题外话。它当前不接受答案。 想要改善这个问题吗? 更新问题,使它成为Stack Overflow的主题。 9年前关闭。 改善这个问题 我正在尝试将更改从DatabaseA复制到DatabaseB,但是我不完全知道这些更改是什么。 是否有一个SQL脚本可以找到数据库之间不同的对象,然后生成一个脚本来更新DatabaseB以匹配DatabaseA? 我正在使用SQL 20
问题内容: 我有一个基本的查询: 我想在输出中添加另一列…让我们称其为“差异”以找出“ dtcreated”和“ dtlastupdated”之间的天数,例如,如果记录1的dtcreated为1/1/11和dtlastupdated为1/1/12,则“差异”列将为“ 365”。 可以在查询中完成吗? 问题答案: 您将使用: 所以对于您的查询:
问题内容: 我必须比较两个时间-电压-电压波形。由于这些波形的源的特殊性,其中一个可以是另一个的时移形式。 我如何找到是否有时移?如果是的话,多少钱。 我正在Python中执行此操作,并希望使用numpy / scipy库。 问题答案: scipy提供了一个相关函数,该函数对于较小的输入以及如果您需要非圆形相关也意味着信号将不会回绕的情况也可以很好地工作。请注意,在中,signal.correla
我有两个数据帧df1和df2,其中df2是df1的子集。我如何获得一个新的数据帧(df3),它是两个数据帧之间的差值? 换句话说,一个数据帧,它包含了df1中所有的行/列,而不是DF2中的行/列?
更新 更准确地说。我想知道这两个列表是否有相同的对象,两个列表都没有额外的对象,顺序无关紧要。例如:
问题内容: 我有两个系列,并以大熊猫为单位,想计算相交点,即该系列的所有值都相同的地方。 我将如何使用该功能执行此操作?我一直在试图解决它,但一直未能(我不想计算上的索引交集和,但对值)。 问题答案: 将两个系列放置在Python的set容器中,然后使用set相交方法: 然后根据需要转换回列表。 刚注意到标签中的熊猫。可以转换为: 从注释中,我将其更改为更Python化的表达式,该表达式更短且更易