当前位置：首页 > 面试题库 >

根据不同列中的值重复行

訾旭

2023-03-14

问题内容：

我有交易数据框。每行代表两个项目的交易（可想而知，就像两张事件票之类的交易一样）。我想根据售出的数量重复每一行。

这是示例代码：

# dictionary of transactions

d = {
    '1': ['20',  'NYC', '2'],
    '2': ['30',  'NYC', '2'],
    '3': ['5',   'NYC', '2'],
    '4': ['300', 'LA',  '2'],
    '5': ['30',  'LA',  '2'],
    '6': ['100', 'LA',  '2']
}

columns=['Price', 'City', 'Quantity']

# create dataframe and rename columns

df = pd.DataFrame.from_dict(
    data=d, orient='index'
)
df.columns = columns

这将产生一个看起来像这样的数据框

Price   City    Quantity
20       NYC         2
30       NYC         2
5        NYC         2
300      LA          2
30       LA          2
100      LA          2

因此，在上述情况下，每一行将转换为两个重复的行。如果“数量”列为3，则该行将转换为三个重复的行。

问题答案：

首先，我使用整数而不是文本重新创建了您的数据。我还更改了数量，以便可以更轻松地理解问题。

d = {1: [20, 'NYC', 1], 2: [30, 'NYC', 2], 3: [5, 'SF', 3],      
     4: [300, 'LA', 1], 5: [30, 'LA', 2],  6: [100, 'SF', 3]}

columns=['Price', 'City', 'Quantity'] 
# create dataframe and rename columns

df = pd.DataFrame.from_dict(data=d, orient='index').sort_index()
df.columns = columns

>>> df
   Price City  Quantity
1     20  NYC         1
2     30  NYC         2
3      5   SF         3
4    300   LA         1
5     30   LA         2
6    100   SF         3

我通过使用嵌套列表理解结构创建了一个新的DataFrame。

df_new = pd.DataFrame([df.ix[idx] 
                       for idx in df.index 
                       for _ in range(df.ix[idx]['Quantity'])]).reset_index(drop=True)
>>> df_new
    Price City  Quantity
0      20  NYC         1
1      30  NYC         2
2      30  NYC         2
3       5   SF         3
4       5   SF         3
5       5   SF         3
6     300   LA         1
7      30   LA         2
8      30   LA         2
9     100   SF         3
10    100   SF         3
11    100   SF         3

类似资料：

根据一列值删除重复的行

问题内容：我有下表，现在我需要删除具有重复的“ refID”但至少有一行与该引用对应的行，即我需要删除第4行和第5行。请对此提供帮助问题答案：这类似于Gordon Linoff的查询，但没有子查询：这将使用内部联接仅删除其中另一行具有相同的refID但具有较低ID的行。避免子查询的好处是能够利用索引进行搜索。该查询在refID + ID上使用多列索引时应表现良好。
根据列值连接不同的表

问题内容：我有一张桌子叫：每个都与一个不同的表相关，field的值指定了我要用于该表的表的名称。所有目标表都有几个相似的列：当前，我正在使用此查询来选择通知，通知它们在目标表中存在相关行，并且其字段为：但是由于它是a ，如果它与任何表都不匹配，它将返回通知，我该如何重写它，以便它不返回与目标表中的任何行都不匹配的通知？我也尝试了不成功的声明。问题答案：我不是100％肯定语法正确，并且现
MySql：根据列重复值删除表行？

问题内容：我有一个带有Year列的表，并且此列不应有重复的值。因此，我最终得到一张仅具有2007年记录的表格。那么，如何删除具有重复年份值的行呢？谢谢问题答案：我认为您可以尝试使用IGNORE添加唯一索引： MySQL应该以类似以下内容的方式进行响应：当然，您可以将其留给MySQL来决定删除哪些行。编辑：这适用于任意多的列：查看有关CREATE INDEX的MySQL文档。一个常
仅根据数据框[重复]中的列名设置值

我得到了这个数据帧，我想根据一些列名分配一个值。像这样。loc[df['max_speed']==1，df['shield']==2，new]=10然后我将获得新的数据帧：有人知道怎么做吗？
根据Postgres中一列（每组）的不同值选择行

我有以下表在PostgreSQL 11. 我想得到具有col1，col2，col3和col4的不同值的行，如果col1，col2，col3相同，则取col1的第一个值。期望的输出是：我试着回答以下问题。如何将输出限制为每col2，col3.获得一个col1值。。例如，选择col1值：3876，不包括3924。
根据来自一列的不同值获取行

如何在中按不同的值获取行？例如，我有下面的数据框：我想根据中的唯一值获取行：那么，我怎样才能得到呢？如果有人可以提供任何帮助，我将不胜感激。

相关阅读

根据两列删除重复项根据条件使用另一张表的列更新列值[重复]SQL：根据其他列中的多个条件来计算一列中的不同值在列中重复值根据列值拆分行

相关文章

不同进制之间的转换 Access重复查询向导同程旅行数据开发面经 MySQL数据库恢复 MySQL恢复数据库

相关问答

列出列值在数据帧中不唯一的行 [重复]根据列名对数据框中的列进行排序[重复]react不根据状态更新localstorage值[重复]根据Java中的一个值重新排列列表选择可能在不同列中具有重复值的行

相关工具

物体根据重力感应运动根据开发者帐号查看App 瀑布效果，不同的实现方式丁丁主数据查重工具首列固定的列表

相关文档

Porter 数据同步中间件 KDB+ 高性能列式数据库中文教程 Rexx 重构的扩展执行程序中文教程鲜活的数据数据可视化指南 Phinx 数据库迁移中文文档