我有一个pandas dataframe对象,如下所示:
one two three four five
0 1 2 3 4 5
1 1 1 1 1 1
我想生成一个列表对象列表,其中第一项是列标签,其余的列表值是列数据值:
nested_list = [['one', 1, 1]
['two', 2, 1]
['three', 3, 1]
['four', 4, 1]
['five', 5, 1]]
我该怎么做?谢谢你的帮助。
严格来说,如果你想要嵌套列表(而不是元组列表),你可以这样做
df.values.tolist()
as df.values是一个numpy数组。这将为您提供所需的列表:
[[0.0001313652121930252, 3.5915356549999985e-05],
[3.5915356549999985e-05, 0.00011634321240684215]]
@上面的BrenBarn答案产生了一个元组列表,而不是问题中所问的列表。我特别需要一个列表列表,以便能够使用DataNitro将数据帧写入spreadsheed。通过列表理解改编了上述示例:
[list(x) for x in dt.T.itertuples()]
这会产生所需的结果
最简单的方法可能是list(dt.t. itertuples())
(其中dt
是数据帧)。这将生成元组列表。
我有一个带有数组列的数据帧: 我读了这个CSV,并将“类”列的值转换成数组: 现在我想选择“类”值中具有“performer_0”的行。像这样: 但是这个代码不起作用: 回溯(最后一次调用):文件“d:\pyenv\pandas\lib\site packages\pandas\core\indexes\base.py”,第2657行,在get_loc return self.\u engine.
问题内容: 我已经看到了将一个列/系列分解为Pandas数据框的多个列的主题的几种变体,但是我一直在尝试做点事情,而实际上并没有成功地使用现有方法。 给定这样的一个DataFrame: 我想将系列中的项目转换为以值作为值的列,如下所示: 我觉得这应该是相对简单的事情,但是由于卷积水平的提高,我已经为此花了几个小时不停地努力,但没有成功。 问题答案: 有几种方法: 使用: 使用: 使用后跟:
我有一个由6列组成的数据框。生成矩阵的最快方法是什么,该矩阵具有以下功能: 步骤1)col1*col1a, col2*col2a, col3*col3a, col4*col4a 步骤2)col_new=(col1*col1a)-col2*col2a)/(col1a-col2a) 使用for循环是选择之一——但是有什么方法可以更快地实现这一点。 我需要有1x3,1x4,1x5,2x3,2x4等等的列
问题内容: 我遇到一种情况,有时当我从中读取时,会得到一个不需要的类似索引的列,名为。 CSV读取与此: 这很烦人!有谁知道如何摆脱这一点? 问题答案: 这是索引列,请通过传递以免将其写出,请参阅文档 例: 与之比较: 您还可以选择通过传递以下内容来判断第一列是索引列:
问题内容: 我有以下DataFrame: 我想增加一列是列的总和,和。 在各个论坛上,我认为这样会起作用: 但事实并非如此。 我想知道适当的操作与列的列表和作为输入。 问题答案: 您可以设置参数以对行求和,这将不忽略任何数字列: 如果您只想汇总特定的列,则可以创建列的列表并删除您不感兴趣的列: