当前位置：首页 > 面试题库 >

熊猫-使用to_csv编写Multiindex行

连晟

2023-03-14

问题内容：

我正在使用to_csv将Multiindex DataFrame写入csv文件。csv文件的一列包含元组中的多索引，例如：

('a', 'x')
('a', 'y')
('a', 'z')
('b', 'x')
('b', 'y')
('b', 'z')

但是，我希望能够将Multiindex输出到两列而不是一列的元组，例如：

a, x
 , y
 , z
b, x
 , y
 , z

看起来tupleize_cols可以为列实现此目的，但对于行则没有这样的选择。有没有办法做到这一点？

问题答案：

我认为这可以做到

In [3]: df = DataFrame(dict(A = 'foo', B = 'bar', value = 1),index=range(5)).set_index(['A','B'])

In [4]: df
Out[4]: 
         value
A   B         
foo bar      1
    bar      1
    bar      1
    bar      1
    bar      1

In [5]: df.to_csv('test.csv')

In [6]: !cat test.csv
A,B,value
foo,bar,1
foo,bar,1
foo,bar,1
foo,bar,1
foo,bar,1

In [7]: pd.read_csv('test.csv',index_col=[0,1])
Out[7]: 
         value
A   B         
foo bar      1
    bar      1
    bar      1
    bar      1
    bar      1

使用索引重复来编写（虽然有点骇人听闻）

In [27]: x = df.reset_index()

In [28]: mask = df.index.to_series().duplicated()

In [29]: mask
Out[29]: 
A    B  
foo  bar    False
     bar     True
     bar     True
     bar     True
     bar     True
dtype: bool

In [30]: x.loc[mask.values,['A','B']] = ''

In [31]: x
Out[31]: 
     A    B  value
0  foo  bar      1
1                1
2                1
3                1
4                1

In [32]: x.to_csv('test.csv')

In [33]: !cat test.csv
,A,B,value
0,foo,bar,1
1,,,1
2,,,1
3,,,1
4,,,1

回读实际上有点棘手

In [37]: pd.read_csv('test.csv',index_col=0).ffill().set_index(['A','B'])
Out[37]: 
         value
A   B         
foo bar      1
    bar      1
    bar      1
    bar      1
    bar      1

类似资料：

熊猫to_csv输出引用问题

获取熊猫
熊猫MultiIndex DataFrame.rolling偏移量

问题内容：为什么在多索引DataFrame时不能使用偏移量？例如，使用：如果我尝试使用偏移量进行分组和滚动，则会显示“ ValueError：窗口必须为整数 ”：并不是说以下这些变体可以满足我的需求，但是请注意对作品进行分组和滚动：我可以在DataFrame的单索引子集上使用偏移量滚动：如果确实不可能在多索引DataFrame上进行偏移滚动，那么将零应用于每个0级索引项的最有效的解决方
防止尾随零熊猫"to_csv"

我试图将CSV字符串导出到D3 Web应用程序，但是命令坚持向数据添加尾随0，这阻止了D3的正确使用。这里有一个简单的例子来说明这个问题。我的（简化）数据帧是：包含一个，如下所示：然后根据这个答案，我运行要获取我想要的格式，请执行以下操作：现在，包含一个
熊猫读取json不适用于MultiIndex

问题内容：我试图读取通过via 创建的数据框，但得到了。我认为这可能与索引为MultiIndex的事实有关，但我不确定如何处理。调用了55k行的原始数据框，并通过以下方式创建了该数据框：如果要使用它，这是输出。当我对这小部分数据（5行）进行处理时，我得到一个。这是完整的堆栈：但是，当我在整个数据帧（55k行）上执行此操作时，我得到一个无效的指针错误，并且IPython内核死亡。有任何想
为熊猫MultiIndex设置一个级别

问题内容：经过一些分组后，我创建了一个具有MultiIndex的DataFrame：如何在MultiIndex前面添加一个级别，以便将其转换为类似以下内容：问题答案：一种使用以下代码完成此操作的好方法：甚至更短的方法：这可以推广到许多数据框架，请参阅docs。
熊猫“to_csv”无法设置报价[关闭]

我在试着按照这里的一些答案做，但是当我设置我收到错误。我做错了什么？我正在运行pandas。

相关阅读

将熊猫MultiIndex切片后，如何更新其水平？大熊猫：按二级索引范围对MultiIndex进行切片使用SQLAlchemy，to_sql用熊猫写入MySQL数据库使用groupby的熊猫fillna 熊猫的CSV写入-附加与写入

相关文章

使用VS2019编写C语言程序使用VS2017编写C语言程序使用VS2015编写C语言程序熊猫优选交互设计师面经使用C-Free编写C语言程序

相关问答

熊猫。to_csv（fileName，quoting=csv.QUOTE）无错误类型错误：to_csv（）获得意外的关键字参数“quoting”使用熊猫read_csv压缩将熊猫df写入csv时的Unicode编码错误大熊猫使用iloc时熊猫设置WithCopyWarning

相关工具

熊猫Flash播放器猫国建设者红猫软路由 TOM猫学说话demo 用ruby写的采集程序

相关文档

Sass Guidelines 编写规范编写 Ruby 的 C 拓展如何编写 jQuery 插件变现猫接入文档 v1.4 跟我一起写 Makefile