当前位置: 首页 > 面试题库 >

为列表中的每个唯一值分配一个数字

从智志
2023-03-14
问题内容

我有一个字符串列表。我想为每个字符串分配一个唯一的数字(确切的数字并不重要),并依次使用这些数字创建一个长度相同的列表。以下是我的最佳尝试,但由于以下两个原因,我不满意:

  1. 假定相同的值彼此相邻

  2. 我必须以开头列表0,否则输出将不正确

我的代码

names = ['ll', 'll', 'll', 'hl', 'hl', 'hl', 'LL', 'LL', 'LL', 'HL', 'HL', 'HL']
numbers = [0]
num = 0
for item in range(len(names)):
    if item == len(names) - 1:
      break
    elif names[item] == names[item+1]:
        numbers.append(num)
    else:
        num = num + 1
        numbers.append(num)
print(numbers)

我想使代码更通用,因此可以使用未知列表。有任何想法吗?


问题答案:

无需使用外部库(检查 EDIT 以获取Pandas解决方案),您可以按照以下步骤进行操作:

d = {ni: indi for indi, ni in enumerate(set(names))}
numbers = [d[ni] for ni in names]

简要说明:

在第一行中,您为列表中的每个唯一元素分配了一个数字(存储在字典中d;您可以使用字典理解功能轻松创建它;set返回的唯一元素names)。

然后,在第二行中,进行列表理解并将实际数字存储在list中numbers

一个示例说明它也可以用于未排序的列表:

# 'll' appears all over the place
names = ['ll', 'll', 'hl', 'hl', 'hl', 'LL', 'LL', 'll', 'LL', 'HL', 'HL', 'HL', 'll']

那是输出numbers

[1, 1, 3, 3, 3, 2, 2, 1, 2, 0, 0, 0, 1]

如您所见,1与之关联的数字ll出现在正确的位置。

编辑

如果你有大熊猫可用,您也可以使用pandas.factorize(这似乎是巨大的名单相当有效,也能正常工作的元组的列表作为解释这里):

import pandas as pd

pd.factorize(names)

然后将返回

(array([(array([0, 0, 1, 1, 1, 2, 2, 0, 2, 3, 3, 3, 0]),
 array(['ll', 'hl', 'LL', 'HL'], dtype=object))

因此,

numbers = pd.factorize(names)[0]


 类似资料:
  • 问题内容: 我希望将一列附加到我的表中,该列将是从顺序列表=到行数的随机数。 因此,如果我的表有 999行 ,则 数字1到999将被随机且唯一地分配 。 现在,我想到可以添加一个虚拟的TempRandomColumn = Rand(),然后对其进行排序,然后使用PHP依次添加数字。但这意味着999条MySQL语句。 有没有办法使用单个MySQL语句来做到这一点? 感谢您的指导。 问题答案:

  • 有人能提出一种有效的方法,在一列中为另一列中的每个唯一值获取最高值吗 np。数组如下所示[column0,column1,column2,column3] 其中我想根据第3列的唯一值返回第1列的最高值。之后的新数组应该是这样的: 我知道如何通过循环来做到这一点,但这不是我所关心的,因为我工作的桌子很大,我想避免循环

  • 我有以下代码,可以很好地将相关数据复制到我的工作表中。我为J列中的每个唯一部门手动创建每个工作表,然后运行此宏。我想要一个基于J列中的唯一值动态创建工作表的宏。我在网上找到了很好的资源,但当它到达已经为其创建了工作表的行时,我发现的资源似乎会出错。在手动创建其他工作表之前,我包含了我当前使用的代码以及我的清单表的屏幕截图

  • 问题内容: 我正在使用MS SQL Server Management Studio。我有桌子- 我想从该表创建另一个包含2列的表,以便column_1在Num_ID中提供唯一值(即1,2,3,4等),而column_2在Alpha_ID中提供唯一值(A,B,C等) 。 但是,如果已经出现一个字母,则不应再次出现。所以输出将是这样的- 希望这是有道理的。我想澄清一下,输入表中的ID不是我所显示的数

  • 问题内容: 如何将所有列表(在“ val”列中)组合成唯一列表(集合),例如? 我可以使用以下代码解决此问题。我想知道是否有一种更简单的方法可以从列中获取所有唯一值而又不迭代数据帧行? 问题答案: 导出到嵌套然后应用于拼合列表的另一种解决方案: 时间 : 如果类型不是,则使用和:

  • 问题内容: 以下代码适用于,它是否也返回重复的笛卡尔积,如果是,如何获得唯一的笛卡尔积? 当我传递包含列表的列表时,这似乎也不起作用 问题答案: 要仅获取唯一元素,可以使用这样的set表示法( 注意: 这不能保证顺序) 或根据Paul Draper的评论,我们可以像这样 如果您也想维护订单 要使您的程序可以使用列表列表,只需将函数声明从 至