当前位置：首页 > 面试题库 >

将熊猫系列从字符串转换为唯一的int id

危璞

2023-03-14

问题内容：

我在系列中有一个类别变量。我想为每个唯一值分配整数ID，并使用ID创建一个新的系列，从而有效地将字符串变量转换为整数变量。最紧凑/最有效的方法是什么？

问题答案：

您可以使用pandas.factorize：

In [32]: s = pd.Series(['a','b','c'])

In [33]: labels, levels = pd.factorize(s)

In [35]: labels
Out[35]: array([0, 1, 2])

类似资料：

熊猫将字符串转换为int

问题内容：我有一个带有ID号的大型数据框：这些现在都是字符串。我想转换为不使用循环-为此我使用。问题是我的某些行包含无法转换为的脏数据，例如如何（不使用循环）删除这些类型的事件，以便我可以放心使用？问题答案：您需要向功能添加参数：如果是列：但非数字会转换为，因此所有值都是。对于需要转换到一些值，例如，然后转换为：样品：编辑：如果使用0.25+大熊猫，则可以使用：
熊猫-将字符串转换为字符串列表[重复]

我有这个“file.csv”文件要和熊猫一起读：使用输出为：我知道，列是一个完整的字符串，因为：我需要将其作为字符串列表来阅读，如。我尝试了这个问题中提供的解决方案，但没有成功，因为我的和字符实际上会把事情搞砸。预期输出应为：
将熊猫数据帧转换为系列

我对熊猫有些陌生。我有一个熊猫数据框，是一行23列。我想把它转换成一个系列？我想知道做这件事最像蟒蛇的方式是什么？我试过pd。系列（我的结果），但它抱怨。它还没有聪明到意识到它仍然是数学术语中的“向量”。谢谢！
将熊猫列转换为DateTime

我有一个字段在熊猫DataFrame被导入为字符串格式。它应该是日期时间变量。如何将其转换为日期时间列，然后根据日期进行筛选。示例：数据帧名称：原始数据
在熊猫中将一行转换为列

请考虑下表：对于每个代码，每一个状态都有一些值。现在我想以这样的方式转置表，使成为列：我不能让它工作，只转置那个特定的列。在熊猫身上实现这一目标的好办法是什么？
熊猫：将系列的数据类型更改为字符串

问题内容：我将Pandas’ver 0.12.0’与Python 2.7结合使用，并具有如下数据框：该系列由一些整数和字符串组成。它在默认情况下是。我想将的所有内容转换为字符串。我试过了，产生下面的输出。 1）如何将的所有元素转换为String？ 2）我最终将用于为数据帧建立索引。与具有整数索引相比，在数据帧中具有String索引会降低速度吗？问题答案：您可以将id的所有元素转换为使用

将熊猫系列从字符串转换为唯一的int id

相关阅读

相关文章

相关问答

相关工具

相关文档