我有这样的df:
col1 col2 col3 col4
1 0 1 0
1 0 1 0
1 0 1 0
1 0 1 0
1 0 1 0
如何将col1-col3
转换为元组列表并分配给变量?然后创建一个只有col4的数组并赋值给变量?
示例最终结果:
lst = [[1,0,1],[1,0,1],[1,0,1],[1,0,1],[1,0,1]]]
lst_col4 = [[0],[0],[0],[0],[0]]
只需为这些colun编制索引,并使用.values
属性:
lst = df[[col1, col2, col3]].values.tolist()
例子:
>>> df = pd.DataFrame({'a':[1,2,3], 'b':[4,5,6], 'c':[7,8,9]})
>>> lst = df[['a', 'c']].values.tolist()
>>> print(lst)
[[1, 7], [2, 8],[3, 9]]
问题内容: 这个问题已经在这里有了答案 : 9年前关闭。 我有两个清单: 我需要从这些列表中创建一个元组列表,如下所示: 我尝试这样做: 但导致: 即x中每个元素与y中每个元素的元组列表…什么是我想做的正确方法?谢谢… 编辑: 在编辑之前提到的其他两个重复是我的错,我将其缩进另一个for循环中是错误的… 问题答案: 使用内置函数: 在Python 3中: 在Python 2中:
问题内容: 我有这样的数据我想创建一个PySpark数据框 我已经用过 但我总是得到 我如何获得如下所示的结果? 问题答案: 我发现将参数视为元组列表很有用,其中列表中的每个条目对应于DataFrame中的一行,而元组的每个元素对应于一列。 您可以通过将列表中的每个元素设为元组来获得所需的输出: 或者,如果更改源很麻烦,则可以等效地执行以下操作:
我有一个列表,我想创建一个名为的扩展。 我不想覆盖,因此不能使用append、extend或insert。我想知道是否有一个快速的方法来完成这项工作(比使用理解列表或Deep.copy更快)
我目前正在尝试创建一个庞大的置换值表。 “loc”内的值是置换的。“loc”中的每个值都来自不同的总体(“pop1”、“pop2”、“pop3”)。到目前为止,我已经能够形成一个庞大的元组列表,它结合了“loc”内的每个重排和“loc”之间的每个重排。 我一直试图将它放入熊猫的数据帧中,但是我在遍历元组列表以放入数据帧时遇到了困难。:( 理想格式: 我的问题是将元组列表放入数据帧中。我需要获得“l
问题内容: 我正在尝试在表中插入数组,但需要将列表转换为SQL Array类型。我正在使用该方法,但出现异常。 我需要传递一个类型名称,但是我不知道这是什么,而且我总是会遇到异常。该数组来自VARCHAR。 我该如何解决插入数组? 代码 堆栈跟踪 问题答案: 使用“ varchar”而不是“ VARCHAR”。参见http://grepcode.com/file/repo1.maven.org/m
问题内容: 我需要增量填充列表或列表元组。看起来像这样: 为了使它不那么冗长,更优雅,我想我会预先分配一个空列表 预分配部分对我来说并不明显。当我这样做时,我会收到对同一列表的引用列表,因此以下内容的输出 是: 我可以使用循环(),但我想知道是否存在“无环”解决方案。 是获得我想要的东西的唯一方法 问题答案: 这将创建x个不同的列表,每个列表都有一个列表副本(该列表中的每个项目都是通过引用提供的,