当前位置: 首页 > 面试题库 >

如果它们具有相同的索引,如何重塑数据框?

堵浩波
2023-03-14
问题内容

如果我有一个像

df= pd.DataFrame(['a','b','c','d'],index=[0,0,1,1])



   0
0个
0 b
1个
1天

我如何根据如下索引重新塑形数据框,即

df= pd.DataFrame([['a','b'],['c','d']],index=[0,1])



  0 1
0 ab
1张

问题答案:

让我们使用set_indexgroupbycumcount,和unstack

df.set_index(df.groupby(level=0).cumcount(), append=True)[0].unstack()

输出:

   0  1
0  a  b
1  c  d


 类似资料:
  • 问题内容: 从这里开始。该解决方案仅适用于一列。如何改进多列解决方案。即如果我有一个像 如何重塑像 如果df是 然后 问题答案: 采用 要么, 另外,索引不相等

  • 根据逻辑,我需要实现两个,如果它们以相同的“相对”顺序具有相同的元素,则它们被认为是相等的。 举个例子,以下一对列表被认为彼此相等: 只要遵守相对顺序,就可以认为它们是平等的。 作为反例,这两个不相等: 导致 和 交换到位。 所以,基本上我发现这很有挑战性,因为这不是顺序完全重要的情况,也不是顺序完全不重要的情况。在这种情况下,我会使用普通的< code>list1.equals(list2)方法

  • 我的数据库中有两个表,这些表具有相同的精确列和数据类型,但顺序不同。 表A有列:A、B、C、D。 表B有以下列:A、C、D、B。 我有一个使用JooQ查询数据库的应用程序,它利用Codigen来创建表格和记录。但是,由于编译错误,它不允许我合并两个选择语句。我能做什么,把两张桌子合并起来? 在union函数内部的变量上,它与SelectUnionStep中的类型不匹配有关。关于union(ARec

  • 问题内容: 我正在查看数据库中的一个表(我没有创建该表),我发现有两个完全相同的索引(我不知道为什么这样做)只是命名不同,这可以对桌子有负面影响吗? 拿这个例子表: 问题答案: 是的,它可以起作用。 当然,如果使用这两个索引,它们会占用磁盘和内存的额外空间。 但是,它们还会使查询优化器做更多的工作来计算每个SELECT期间每个索引的收益。您拥有的索引越多,需要比较的案例就越多。因此,消除真正的冗余

  • hashmap计算索引的方式如下代码- 现在假设第二次使用一个键(比如说另一次put),此时长度已经改变。在这种情况下,在长度为16和长度为64时如何返回相同的索引?

  • 我有以下数组列表: 其中包括: 卫生间编号:[、、、230、230、230、5000、4000、4000、17000、] 限制标志:[,,,,-,-,-,,,,,,,,] 它们有相同的尺寸,你怎么能意识到有空的物品,但没关系。 我需要用相同的索引连接每个ArrayList,结果必须是: [, , , , 230-, 230-, 230-, 5000 , 4000 , 4000 , 17000, ]