我有一个数据框架,我想从其中一列的列表中创建5列
示例:
df :
ID Data
1 ['A1','A2','A3','A4','A5']
2 ['A2','A3','A4','A5']
请注意,这里很少有列表少于5列,对于这些列,请在该位置插入NAN。
Output df:
ID Col1 Col2 Col3 Col4 Col5 Data
1 A1 A2 A3 A4 A5 ['A1','A2','A3','A4','A5']
2 A2 A3 A4 A5 Nan ['A2','A3','A4','A5']
df = pd.DataFrame({
'ID': [1, 2],
'Data': [['A1','A2','A3','A4','A5'], ['A2','A3','A4','A5']]
})
df.join(df['Data'].apply(pd.Series))
输出:
ID Data 0 1 2 3 4
0 1 ['A1', 'A2', 'A3', 'A4', 'A5'] A1 A2 A3 A4 A5
1 2 ['A2', 'A3', 'A4', 'A5'] A2 A3 A4 A5 NaN
问题内容: 我有看起来像的数据框: 为了进一步处理数据,我需要拆分该列,然后将其替换为如下所示的多列: 因此,这些列可以追加到初始数据帧。我不知道该怎么做,因为像 不能解决我的问题,因为我不仅需要基于列表中位置的列,还需要基于列表中每个唯一值的列。您知道我该如何处理吗? 问题答案: 您可以使用和: 如果需要计数值,则可以使用(我添加一个字符串进行测试):
我有一个功能: 以及数据帧: 我想将每行的组和名称输入到我的“lookup”函数中,并将该行的答案作为第三列中的单元格返回:“value” 我已经看了这个和这个问题。但他们不完全是我在做的。 我也研究过这个问题。这就是我正在做的。但对我来说也没有成功。 我试过这个: 和这个: 但它只会使值列全部为“NULL” 这里的任何建议都非常感谢。
我正在尝试使用一个函数从pandas数据帧中的多个列计算多个列。该函数接受三个参数-a-、-b-和-c-,并返回三个计算值-sum-、-prod-和-quot-。在我的pandas数据框架中,我有三个列-a-、-b-和-c-我想从中计算列-sum-、-prod-和-quot-。 我所做的映射只有在正好有三行时才起作用。我不知道出了什么问题,尽管我认为这与选择正确的轴有关。有人能解释一下发生了什么,
问题内容: 我有一个数据框,其中某些单元格包含多个值的列表。我不想扩展一个单元格中的多个值,而是想扩展数据框,以便列表中的每个项目都有自己的行(所有其他列中的值都相同)。所以,如果我有: 如何转换为长格式,例如: 索引并不重要,可以将现有的列设置为索引也可以,最后的顺序也不重要。 问题答案: 结果: PS 在这里你可能会发现一些通用的解决方案 更新:一些解释:IMO了解此代码的最简单方法是尝试逐步
问题内容: 我有一个时序DataFrame,我想复制我的200个功能/列中的每一个作为其他滞后功能。因此,目前我在时间t处具有要素,并希望在时间步t-1,t-2等处创建要素。 我知道最好用df.shift()来完成,但是我很难将其完全合并。我还想将列重命名为“功能(t-1)”,“功能(t-2)”。 我的伪代码尝试将是这样的: 最后,如果我有200列和4个滞后时间步长,那么我将拥有一个具有1000个
我想在Pandas数据集中创建一个新列,基于另外两个列的值。 现在,应该如下所示: 有什么帮助吗?