我目前正在做一个熊猫的数据框架。我正在重新格式化数据,以便在运行分析时更容易理解。列中的默认数据是一个字符串,类似于< code> something | something。例如< code >事故|可修复损坏。
我想在dataframe中创建两个新列,将字符串拆分为两个不同的字符串,并将拆分字符串的不同部分分配给不同的列。
Incident_Category |
------------------------------
Accident | repairable-damage
Accident | repairable-damage
Accident | hull-loss
这是预期的输出:
Incident_Category | Incident_Type | Incident_Damage |
----------------------------------------------------------------
Accident | repairable-damage | Accident | repairable-damage
Accident | repairable-damage | Accident | repairable-damage
Accident | hull-losss | Accident | hull-losss
这是我目前拥有的代码:
print(dropped_dataset['Incident_Category'].unique())
dropped_dataset['Incident_type_array'] = dropped_dataset['Incident_Category'].str.split("|")
dropped_dataset['Incident_type'] = dropped_dataset['Incident_type_array'][0][0]
dropped_dataset['Incident_damage'] = dropped_dataset['Incident_type_array'][[1]]
dropped_dataset.head(7)
它当前正在获取第一条记录,并为整个数据帧列分配第一行详细信息。
我希望每一行Incident_Category
被拆分和分配。
我们可以用<代码>熊猫。Series.str.split:
dropped_dataset[['Incident_Type', 'Incident_Damage']] = dropped_dataset.Incident_Category.str.split(" | ", expand=True, regex=False)
问题内容: 我有一个数组: 我想获得此数组的第一个元素。预期结果: 字符串 一个要求: 它不能通过引用传递来完成 ,所以不是一个好的解决方案。 我怎样才能做到这一点? 问题答案: 原始答案,但代价昂贵(O(n)): 在O(1)中: 其他用例等 如果修改(就重置数组指针而言)不是问题,则可以使用: 如果需要数组“副本”,则从理论上讲应该更有效: 使用PHP 5.4+(但如果为空,则可能导致索引错误)
返回数组的第一个元素。 使用 arr[0] 返回传递数组的第一个元素。 const head = arr => arr[0]; head([1, 2, 3]); // 1
问题内容: 我有一个像下面这样的列表,其中第一个元素是id,另一个是字符串: 我只想从此元组列表创建ID列表,如下所示: 我将使用此列表,因此它必须是整数值的列表。 问题答案:
问题内容: 我有这个数组: 我想要这个数组: 如何从一对货币中提取价值? 问题答案: 您可以使用map来获取元组的第一个元素,如下所示:
如果我有一个双打数组: 我想得到第一个元素和最后一个元素,这样 我该怎么做?
问题内容: 返回以下内容的最紧凑的方法是什么: 给定一个元组列表,返回一个由元组的第一个(或第二个,无关紧要)元素组成的列表。 对于: 返回的列表将是 问题答案: 如果需要同时使用zip