所以我得到了一个看起来像这样的数据帧:原始数据帧
df = pd.DataFrame({'0': ['a', 'b', 'c', 'd'],
'1': [123,145,293,403],
'2': [402,103,242,757],
'3': [3.121,4.55,0,9.32],
'4': ['3T', '4B', '400B', '400T']})
我需要对数据帧进行转换,使其看起来如下所示:
有谁知道怎么用熊猫?
您可以使用堆栈()
然后使用转置
s = df.set_index('0').stack()
s.index = [f"{x}_{y}" for x,y in s.index]
s.to_frame('').T
a_1 a_2 a_3 a_4 b_1 b_2 b_3 b_4 c_1 c_2 c_3 c_4 d_1 d_2 d_3 \
123 402 3.121 3T 145 103 4.55 4B 293 242 0 400B 403 757 9.32
d_4
400T
假设熊猫数据帧如下所示: 如何将第三行(如row3)提取为pd数据帧?换句话说,row3.shape应该是(1,5),row3.head()应该是:
问题内容: 我正在使用python 3.6并尝试使用以下代码将json文件(350 MB)下载为pandas数据框。但是,出现以下错误: 我该如何解决错误? 问题答案: 如果以二进制()格式打开文件,则会得到字节。怎么样:
Python是如何将CSV文件读入pandas数据帧的(我可以使用它进行统计操作,可以有不同类型的列,等等)? 我的CSV文件有以下内容: 在R中,我们将使用以下方法读取此文件: 这将返回一个R数据。框架: 有没有类似python的方法来获得相同的功能?
我想知道是否可以使用pandas函数将数据帧添加到现有的csv文件中。csv文件的结构与加载的数据相同。
我有一个1.5GB.dat文件需要作为pandas数据帧导入,我遇到了内存问题(8GB RAM)。如何将dat文件分解成块来执行分析?
问题内容: 如何将大数据文件分块写入CSV文件? 我有一组大型数据文件(1M行x 20列)。但是,我只关注该数据的5列左右。 我想通过只用感兴趣的列制作这些文件的副本来使事情变得更容易,所以我可以使用较小的文件进行后期处理。因此,我计划将文件读取到数据帧中,然后写入csv文件。 我一直在研究将大数据文件以块的形式读入数据框。但是,我还无法找到有关如何将数据分块写入csv文件的任何信息。 这是我现在