当前位置：首页 > 面试题库 >

在熊猫中设置多列索引

凌翔宇

2023-03-14

问题内容：

我这样制作数据框。

df = pd.DataFrame({
    'class' : ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
    'number' : [1,2,3,4,5,1,2,3,4,5],
    'math' : [90, 20, 50, 30, 57, 67, 89, 79, 45, 23],
    'english' : [40, 21, 68, 89, 90, 87, 89, 54, 21, 23]
})

我想通过使用一些熊猫方法将索引转换为此（例如set_index，stack 、、）

df1 = pd.DataFrame(np.random.randint(1, 100, (5, 4)),
             columns = [['A', 'A', 'B', 'B'],['english', 'math', 'english', 'math']],
             index = [1, 2, 3, 4, 5])

我怎样才能做到这一点？

问题答案：

我认为你需要set_index与unstack重塑，然后交换在水平MultiIndex由列swaplevel由去年的排序列sort_index：

df1 = df.set_index(['number','class']).unstack().swaplevel(0,1,1).sort_index(1)

print (df1)
class        A            B     
       english math english math
number                          
1           40   90      87   67
2           21   20      89   89
3           68   50      54   79
4           89   30      21   45
5           90   57      23   23

用另一种解决方案stack和unstack：

print (df.set_index(['number','class']).stack().unstack([1,2]))
class        A            B     
       english math english math
number                          
1           40   90      87   67
2           21   20      89   89
3           68   50      54   79
4           89   30      21   45
5           90   57      23   23

类似资料：

熊猫set_index不设置索引

问题内容：假设我用两列（一个DateTime）和一个（整数）创建了一个熊猫DataFrame 。现在，我想根据第一列（）中的值创建一个DatetimeIndex ：一切似乎都正常，除了我打印DataFrame时，它说它具有Int64Index。我是在做错事还是不正确理解Indeces的概念？问题答案：没有就位（除非您通过）。否则一切正确同样作为参考，在即将到来的0.12版本（下周）中，
熊猫在系列上重置索引以删除多索引

问题内容：我创建了一个从，当我重新采样一些数据，象这样一个数：其中是：这产生了一个看起来像这样的系列：索引看起来像：我不希望第二列作为索引。理想情况下，我将第1列作为“日期”，将第2列作为“销售”（删除索引的第二层）。我不太清楚如何重新配置索引。问题答案：只需致电：有多种删除列的方法：调用两次并指定一列：重置索引后删除列：重置后致电：然后，在重置索引后，只需重命名列
在熊猫中设置联盟

问题内容：我有两列，将集存储在数据框中。我想使用快速向量化操作在两列上执行集合并集但是错误使我无法这样做，因为我在两列中都输入了内容。有解决这个问题的好方法吗？问题答案：对于这些操作，纯Python可能更有效。如果我们可以使用，则可能会花费一半的时间（继承可能不值得）：时序的DataFrame：
多列熊猫get_dummies

问题内容：我有一个包含多个列的数据集，我希望对其进行一次热编码。但是，我不想为每个编码都有编码，因为所说的列与所说的项目有关。我想要的是一组使用所有列的虚拟变量。请参阅我的代码以获得更好的解释。假设我的数据框如下所示：如果我执行输出将是但是，我想获得的是这样的东西：代替具有表示编码，例如多列的和，我只希望有一组（，，等等）与值时任何在列中的值的，，显示出来。需要说明的是，在我的原始数
从多索引熊猫中选择

问题内容：我有一个带有列“ A”和“ B”的多索引数据框。有没有一种方法可以通过在多索引的一列上进行过滤而不选择将索引重新设置为单列索引来选择行？例如。问题答案：一种方法是使用Index方法：在0.13，你就可以使用与参数：注意：如果这是列MultiIndex而不是索引，则可以使用相同的技术：
熊猫多索引的好处？

问题内容：因此，我了解到可以使用DataFrame.groupby而不用使用MultiIndex进行子采样/横截面。另一方面，当我在DataFrame上具有MultiIndex时，仍然需要使用DataFrame.groupby进行子采样/横截面。那么，除了在打印时非常有用和漂亮地显示层次结构之外，MultiIndex有什么好处？问题答案：在pandas 0.4版本中引入了分级索引（也称为

相关阅读

从多索引熊猫中选择熊猫多索引的好处？设置熊猫数据框中的列顺序在熊猫中保存csv时删除索引列如何在熊猫数据框中重置索引？

相关文章

Jsoup 设置HTML 阿里天猫海购交互设计面经面试阿里巴巴天猫交互设计师拼多多设计秋招一面拼多多｜交互设计一面

相关问答

熊猫：设置最大行数重命名熊猫中的多个列如何在熊猫数据库中重置索引？[副本]替换熊猫多索引数据帧中的值熊猫重置索引未生效[重复]

相关工具

熊猫Flash播放器猫国建设者仿天猫App可打开列表红猫软路由多级树形目录列表

相关文档

ZUK Z2 (z2_plus) 设备配置变现猫接入文档 v1.4 设计模式 Google API Design Guide 谷歌API设计指南中文版 KDB+ 高性能列式数据库中文教程