按列值拆分数据帧

羊舌青青

2023-03-14

我有DataFrame列Sales。

如何根据Sales值将其拆分为2？

第一个DataFrame将包含为“Sales”的数据

共有3个答案

陈毅

2023-03-14

使用“Groupby”和列表理解：

将所有拆分的数据帧存储在列表变量中，并通过索引访问每个拆分的数据帧。

DF = pd.DataFrame({'chr':["chr3","chr3","chr7","chr6","chr1"],'pos':[10,20,30,40,50],})
ans = [y for x, y in DF.groupby('chr', as_index=False)]

像这样访问分离的DF：

ans[0]
ans[1]
ans[len(ans)-1] # this is the last separated DF

按如下方式访问分隔DF的列值：

ansI_chr=ans[i].chr

谈秦斩

2023-03-14

使用Groupby，您可以将数据帧分成两个，如

In [1047]: df1, df2 = [x for _, x in df.groupby(df['Sales'] < 30)]

In [1048]: df1
Out[1048]:
   A  Sales
2  7     30
3  6     40
4  1     50

In [1049]: df2
Out[1049]:
   A  Sales
0  3     10
1  4     20

太叔鸿博

2023-03-14

您可以使用布尔索引：

df = pd.DataFrame({'Sales':[10,20,30,40,50], 'A':[3,4,7,6,1]})
print (df)
   A  Sales
0  3     10
1  4     20
2  7     30
3  6     40
4  1     50

s = 30

df1 = df[df['Sales'] >= s]
print (df1)
   A  Sales
2  7     30
3  6     40
4  1     50

df2 = df[df['Sales'] < s]
print (df2)
   A  Sales
0  3     10
1  4     20

也可以通过~反转掩码：

mask = df['Sales'] >= s
df1 = df[mask]
df2 = df[~mask]
print (df1)
   A  Sales
2  7     30
3  6     40
4  1     50

print (df2)
   A  Sales
0  3     10
1  4     20

print (mask)
0    False
1    False
2     True
3     True
4     True
Name: Sales, dtype: bool

print (~mask)
0     True
1     True
2    False
3    False
4    False
Name: Sales, dtype: bool

类似资料：

根据列值拆分行

问题内容：我试图根据该行的单元格中的值将其分为两行。例如，我具有以下表结构（这是一个临时表，没有任何键，索引或任何其他内容，我可以在另一个临时表中选择拆分结果）：然后，应将其拆分为：问题答案：我将使用
根据ascii值拆分列

问题内容：我在包含一个大字符串的表中有一个文本字段，我要分离的字符串的每个部分都被一个小方块分开。搜索时，我发现这可能是一个ascii值，所以我运行了它返回 27 如何根据此ascii值将该字段拆分为单独的字段？预先感谢克里斯编辑：当前数据看起来像什么的例子。如果可能的话，将TEXT放在=之前作为标题将非常有用。 ABS_ID = 1234567 PERSON_ID = 123456
基于列值拆分/展开数据帧

我有一个像下面这样的DataFrame，标识符作为现有DateIndex顶部的列。我的目标是为除id之外的每一列（a和B）创建一个新的子DataFrames，其中dateIndex作为单个索引，id（foo,bar）作为列名。预期产出如下所示：
拆分pyspark数据帧列并限制拆分

我有下面的spark数据框架。我必须将上面的数据帧列拆分为多个列，如下所示。我尝试使用分隔符进行拆分；和限制。但是它也将主题拆分为不同的列。姓名和年龄被组合在一起成一列。我要求所有主题在一列中，只有姓名和年龄在单独的列中。这在Pyspark有可能实现吗？
SQLite根据另一列的值拆分列

我有一个数据库，其中多个变量显示为连续的行（如下所示，变量由其标记区分）。因此，它们的值在“值”列中显示为连续行。现有表格：对于数据分析，我需要将每个变量的值拆分为单独的列，如下所示。下面列出了SQLite查询。我曾尝试使用分组标记并平均值，但结果变得过于细粒度，无法使用。建议将不胜感激！
Pandas：基于列中的空值拆分数据帧[duplicate]

我有一个数据帧如下所示：如何根据性别的np值转换dataframe？我想要原始数据帧df被拆分为df1（姓名，年龄，性别，高度，日期），它将具有性别的值（df的前3行）

按列值拆分数据帧

共有3个答案

相关问答

相关文章

相关阅读

相关工具

相关文档