当前位置：首页 > 面试题库 >

具有多索引列的熊猫数据框-合并级别

孙翰墨

2023-03-14

问题内容：

我有一个数据框，grouped具有以下的multiindex列：

import pandas as pd
codes = ["one","two","three"];
colours = ["black", "white"];
textures = ["soft", "hard"];
N= 100 # length of the dataframe
df = pd.DataFrame({ 'id' : range(1,N+1),
                    'weeks_elapsed' : [random.choice(range(1,25)) for i in range(1,N+1)],
                    'code' : [random.choice(codes) for i in range(1,N+1)],
                    'colour': [random.choice(colours) for i in range(1,N+1)],
                    'texture': [random.choice(textures) for i in range(1,N+1)],
                    'size': [random.randint(1,100) for i in range(1,N+1)],
                    'scaled_size': [random.randint(100,1000) for i in range(1,N+1)]
                   },  columns= ['id', 'weeks_elapsed', 'code','colour', 'texture', 'size', 'scaled_size'])
grouped = df.groupby(['code', 'colour']).agg( {'size': [np.sum, np.average, np.size, pd.Series.idxmax],'scaled_size': [np.sum, np.average, np.size, pd.Series.idxmax]}).reset_index()

>> grouped
    code colour     size                           scaled_size                         
                    sum    average  size  idxmax            sum    average  size  idxmax
0    one  black    1031  60.647059    17      81     185.153944  10.891408    17      47
1    one  white     481  37.000000    13      53     204.139249  15.703019    13      53
2  three  black     822  48.352941    17       6     123.269405   7.251141    17      31
3  three  white    1614  57.642857    28      50     285.638337  10.201369    28      37
4    two  black     523  58.111111     9      85      80.908912   8.989879     9      88
5    two  white     669  41.812500    16      78      82.098870   5.131179    16      78
[6 rows x 10 columns]

如何将列索引级别展平/合并为：“ Level1 |
Level2”，例如size|sum，scaled_size|sum。等等？如果这不可能，是否有办法groupby()像我上面所做的那样不创建多索引列？

问题答案：

您可以随时更改列：

grouped.columns = ['%s%s' % (a, '|%s' % b if b else '') for a, b in grouped.columns]

类似资料：

大熊猫：在多列上合并（合并）两个数据框

问题内容：我正在尝试使用两列来连接两个熊猫数据框：但出现以下错误：任何想法应该是正确的方法吗？谢谢！问题答案：尝试这个 https://pandas.pydata.org/pandas- docs/stable/reference/api/pandas.DataFrame.merge.html left_on：要在左侧DataFrame中加入的标签或列表或类似数组的字段名称。可以是Dat
Python：熊猫合并了多个数据框

问题内容：我有不同的数据框，需要根据日期列将它们合并在一起。如果我只有两个数据帧，则可以使用来对三个数据帧进行操作，但是，使用多个数据帧将变得非常复杂且难以读取。所有数据框都有一个共同的列- ，但是它们没有相同数量的行或列，而我只需要每个数据框共有每个日期的那些行。因此，我正在尝试编写一个递归函数，该函数返回一个包含所有数据的数据框，但是它不起作用。那我应该如何合并多个数据框？我试图dif
熊猫数据框到没有索引的JSON

问题内容：我正在尝试采用一个数据框并将其转换为特定的json格式。这是我的数据框示例：这是我想转换成的json格式：注意这是字典列表。我几乎在下面的代码中：但是，该行还包含这样的索引：请注意，这是一个字典，它还包含两次索引（在第一个字典中为索引，在第二个字典中为“ id”！对您有所帮助。问题答案：您可以使用
将索引转换为列熊猫数据框

问题内容：我有以下熊猫数据框：我想将日期时间索引转换为数据框的列。我尝试过，但结果没有改变。任何想法？问题答案：需要分配输出或参数：
熊猫合并具有不同列的两个数据帧

我肯定错过了一些简单的东西。尝试合并熊猫中的两个数据帧，它们的列名基本相同，但右边的数据帧有一些左边没有的列，反之亦然。我已尝试使用外部联接进行联接：但这会产生：我还指定了一个要连接的列（例如，on="id"），但这会重复所有列，除了"id"，如attr_1_x、attr_1_y，这并不理想。我还传递了整个列列表（有很多）到on：其产生：我错过了什么？我想得到一个附加了所有行的df，并且
熊猫加入/合并/合并两个数据框

问题内容：我在加入熊猫方面遇到问题，并且试图找出问题所在。假设我有一个x：我应该能够通过简单的连接命令在y = x上将y与索引上的y联接，除了同名具有+2。我希望决赛对双方都有1941个非值。我也尝试过合并，但是我有同样的问题。我以为正确的答案是pandas.concat（[x，y]），但这也不符合我的预期。编辑：如果您在加入方面遇到问题，请阅读下面的韦斯答案。我有一个重复的时间戳。问

相关阅读

熊猫加入/合并/合并两个数据框格式化熊猫数据框索引日期堆叠数据框列（熊猫）在熊猫中设置多列索引熊猫多索引的好处？

相关文章

MySQL高性能的索引策略(1)：前缀索引、索引选择性、联合索引、覆盖索引 MySQL哈希索引的数据结构以及索引的优缺点 Sql优化-索引合并 index merge 造成死锁 Tkinter列表框和组合框 JSF多选列表框

相关问答

熊猫：具有重复索引的海螺替换熊猫多索引数据帧中的值使用索引值列表切片熊猫多索引数据帧[重复]删除具有重复索引的熊猫行熊猫数据框中的列到行

相关工具

熊猫Flash播放器多级树形目录列表数据库处理框架 Redis数据查看工具元搜索引擎

相关文档

具有高级安全性的 Windows 防火墙 Java 并发性和多线程鲜活的数据数据可视化指南 SQL 合计函数 KDB+ 高性能列式数据库中文教程