问题：

pandas数据帧透视表[副本]

巫懿轩

2023-03-14

+---------+-------+------------+----------+
| subject | pills |    date    | strength |
+---------+-------+------------+----------+
|       1 |     4 | 10/10/2012 |      250 |
|       1 |     4 | 10/11/2012 |      250 |
|       1 |     2 | 10/12/2012 |      500 |
|       2 |     1 | 1/6/2014   |     1000 |
|       2 |     1 | 1/7/2014   |      250 |
|       2 |     1 | 1/7/2014   |      500 |
|       2 |     3 | 1/8/2014   |      250 |
+---------+-------+------------+----------+

reshape(df, idvar = c("subject","date"), timevar = 'strength', direction = "wide")

+---------+------------+--------------+--------------+---------------+
| subject |    date    | strength.250 | strength.500 | strength.1000 |
+---------+------------+--------------+--------------+---------------+
|       1 | 10/10/2012 | 4            | NA           | NA            |
|       1 | 10/11/2012 | 4            | NA           | NA            |
|       1 | 10/12/2012 | NA           | 2            | NA            |
|       2 | 1/6/2014   | NA           | NA           | 1             |
|       2 | 1/7/2014   | 1            | 1            | NA            |
|       2 | 1/8/2014   | 3            | NA           | NA            |
+---------+------------+--------------+--------------+---------------+

df.pivot_table(df, index=['subject','date'],columns='strength')

+---------+------------+-------+----+-----+
|         |            | pills            |
+---------+------------+-------+----+-----+
|         | strength   | 250   | 500| 1000|
+---------+------------+-------+----+-----+
| subject | date       |       |    |     |
+---------+------------+-------+----+-----+
| 1       | 10/10/2012 | 4     | NA | NA  |
|         | 10/11/2012 | 4     | NA | NA  |
|         | 10/12/2012 | NA    | 2  | NA  |
+---------+------------+-------+----+-----+
| 2       | 1/6/2014   | NA    | NA | 1   |
|         | 1/7/2014   | 1     | 1  | NA  |
|         | 1/8/2014   | 3     | NA | NA  |
+---------+------------+-------+----+-----+

共有1个答案

汪成仁

2023-03-14

转轴后，将dataframe转换为记录，然后再转换回dataframe：

flattened = pd.DataFrame(pivoted.to_records())
#   subject        date  ('pills', 250)  ('pills', 500)  ('pills', 1000)
#0        1  10/10/2012             4.0             NaN              NaN
#1        1  10/11/2012             4.0             NaN              NaN
#2        1  10/12/2012             NaN             2.0              NaN
#3        2    1/6/2014             NaN             NaN              1.0
#4        2    1/7/2014             1.0             1.0              NaN
#5        2    1/8/2014             3.0             NaN              NaN

如果需要，现在可以“修复”列名：

flattened.columns = [hdr.replace("('pills', ", "strength.").replace(")", "") \
                     for hdr in flattened.columns]
flattened
#   subject        date  strength.250  strength.500  strength.1000
#0        1  10/10/2012           4.0           NaN            NaN
#1        1  10/11/2012           4.0           NaN            NaN
#2        1  10/12/2012           NaN           2.0            NaN
#3        2    1/6/2014           NaN           NaN            1.0
#4        2    1/7/2014           1.0           1.0            NaN
#5        2    1/8/2014           3.0           NaN            NaN

很尴尬，但很管用。

类似资料：

如何透视数据帧？

什么是透视？如何透视？这是枢轴吗？长格式到宽格式？我见过很多关于透视表的问题。即使他们不知道他们询问的是透视表，他们通常也是。几乎不可能写出一个包含旋转的所有方面的规范的问题和答案。 ...但我要试一试。现有问题和答案的问题是，问题通常集中在一个细微差别上，而OP很难将其概括出来，以便使用现有的许多好答案。然而，没有一个答案试图给出一个全面的解释（因为这是一个令人生畏的任务）从我的谷歌
A 数据透视表和数据透视图表

A 数据透视表介绍 B.1 什么是数据透视表？数据透视表是一种可以快速汇总、分析大量数据表格的交互式工具。使用数据透视表可以按照数据表格的不同字段从多个角度进行透视，并建立交叉表格，用以查看数据表格不同层面的汇总信息、分析结果以及摘要数据。使用数据透视表可以深入分析数值数据，以帮助用户发现关键数据，并做出有关企业中关键数据的决策。数据透视表是针对以下用途特别设计的：以友好的方式，查看大量的数据
Python Pandas数据帧到CSV[副本]

你好，我有一个pandas系列的数据文件名“boilerinfo”来自一个API请求，我想创建一个CSV文件的数据。我该怎么做？ python可以在这个目录中创建一个CSV文件吗？C:\users\lingbart\documents\python\wb Data
Pandas：对数据透视表进行排序

问题内容：第一次尝试熊猫，我试图先按照索引对数据透视表进行排序，然后再对一系列值进行排序。到目前为止，我已经尝试过：按索引然后按值对数据透视表进行排序的正确方法是什么？问题答案：这是一个可以做您想要的解决方案：结果将如下所示：将其作为API方法内置到熊猫中会很好。虽然不确定应该是什么样。
如何透视Spark数据帧？

我开始使用Spark DataFrames，我需要能够枢轴的数据，以创建多个列1列多行。在Scalding中有内置的功能，我相信Python中的熊猫，但是我找不到任何新的Spark Dataframe。我假设我可以编写某种自定义函数来实现这一点，但我甚至不知道如何开始，特别是因为我是Spark的新手。如果有人知道如何使用内置功能或如何在Scala中编写东西的建议来实现这一点，我们将不胜感激。
数据透视表

数据透视表显示二维交集的度量值，并在表格视图中表示数据。图表属性选择图表类型后，可以更改其属性来自定义图表：选项描述常规背景颜色设置图表区域的背景颜色。不透明度设置背景颜色的不透明度。显示边框显示图表外部边框。边界颜色设置图表外部边框的颜色。显示标题显示图表的主要标题。标题指定图表的标题。标题字体设置标题的字体样式。位置设置标题的位置。对齐设置标题的水

pandas数据帧透视表[副本]

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档