问题：

熊猫们在混乱中但秩序井然

查宜修

2023-03-14

假设我有一个由三列组成的数据框架：年龄、性别和国家。

我想随机洗牌这些数据，但在一个有序的方式根据性别。有n个雄性和m个雌性，其中n可以小于、大于或等于m。洗牌应该以这样的方式进行，我们可以在8人的情况下得到以下结果：

男性，女性，男性，女性，男性，女性，女性，女性，......（如果有更多的女性：m

df = pd.DataFrame({'Age': [10, 20, 30, 40, 50, 60, 70, 80],
                   'Gender': ["Male", "Male", "Male", "Female", "Female", "Male", "Female", "Female"], 
'Country': ["US", "UK", "China", "Canada", "US", "UK", "China", "Brazil"]})

共有2个答案

弓举

2023-03-14

使用'Sort\u Column'创建两个新的数据帧，并将df\u maledataframe值设为偶数，将df\u maledataframe值设为奇数。然后，使用pd.concat将它们重新组合在一起，并在'sort\u Column'上使用.sort\u values（）。

df = pd.DataFrame({'Age': [10, 20, 30, 40, 50, 60, 70, 80],
                   'Gender': ["Male", "Male", "Male", "Female", "Female", "Male", "Female", "Female"], 
'Country': ["US", "UK", "China", "Canada", "US", "UK", "China", "Brazil"]})
df['Sort_Column'] = 0
df_male = df.loc[df['Gender'] == 'Male'].reset_index(drop=True)
df_male['Sort_Column'] = df_male['Sort_Column'] + df_male.index*2
df_female = df1.loc[df1['Gender'] == 'Female'].reset_index(drop=True)
df_female['Sort_Column'] = df_female['Sort_Column'] + df_female.index*2 + 1
df_sorted=pd.concat([df_male, df_female]).sort_values('Sort_Column').drop('Sort_Column', axis=1).reset_index(drop=True)
df_sorted

输出：

    Age Gender  Country
0   10  Male    US
1   40  Female  Canada
2   20  Male    UK
3   50  Female  US
4   30  Male    China
5   70  Female  China
6   60  Male    UK
7   80  Female  Brazil

姬康平

2023-03-14

首先添加每个组内的序列号：

df['Order'] = df.groupby('Gender').cumcount()

然后排序：

df.sort_values('Order')

它给你：

   Age  Gender Country  Order
0   10    Male      US      0
3   40  Female  Canada      0
1   20    Male      UK      1
4   50  Female      US      1
2   30    Male   China      2
6   70  Female   China      2
5   60    Male      UK      3
7   80  Female  Brazil      3

如果您想洗牌，请在最开始时执行，例如，df=df.sample（frac=1），请参阅：洗牌数据帧行

熊猫们在混乱中但秩序井然

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档