当前位置：首页 > 面试题库 >

用分隔符pandas python拆分列

卢光远

2023-03-14

问题内容：

我有一个小样本数据：

import pandas as pd

df = {'ID': [3009, 129,119,120,121,122,130,3014,266,849,174,844 ],
  'V': ['IGHV7-B*01','IGHV7-B*01','IGHV6-A*01','GHV6-A*01','IGHV6-A*01','IGHV6-A*01','IGHV4-L*03','IGHV4-L*03','IGHV5-A*01','IGHV5-A*04','IGHV6-A*02','IGHV6-A*02'],
  'Prob': [1,1,0.8,0.8056,0.9,0.805 ,1,1,0.997,0.401,1,1]}


df = pd.DataFrame(df)

好像

df

Out[25]: 
      ID    Prob           V
0    3009  1.0000  IGHV7-B*01
1     129  1.0000  IGHV7-B*01
2     119  0.8000  IGHV6-A*01
3     120  0.8056  IGHV6-A*01
4     121  0.9000  IGHV6-A*01
5     122  0.8050  IGHV6-A*01
6     130  1.0000  IGHV4-L*03
7    3014  1.0000  IGHV4-L*03
8     266  0.9970  IGHV5-A*01
9     849  0.4010  IGHV5-A*04
10    174  1.0000  IGHV6-A*02
11    844  1.0000  IGHV6-A*02

我想用’-‘分隔符分隔列’V’并将其移至另一个名为’allele’的列

    Out[25]: 
      ID    Prob      V    allele
0    3009  1.0000  IGHV7    B*01
1     129  1.0000  IGHV7    B*01
2     119  0.8000  IGHV6    A*01
3     120  0.8056  IGHV6    A*01
4     121  0.9000  IGHV6    A*01
5     122  0.8050  IGHV6    A*01
6     130  1.0000  IGHV4    L*03
7    3014  1.0000  IGHV4    L*03
8     266  0.9970  IGHV5    A*01
9     849  0.4010  IGHV5    A*04
10    174  1.0000  IGHV6    A*02
11    844  1.0000  IGHV6    A*02

到目前为止，我尝试过的代码不完整，无法正常工作：

df1 = pd.DataFrame()
df1[['V']] = pd.DataFrame([ x.split('-') for x in df['V'].tolist() ])

要么

df.add(Series, axis='columns', level = None, fill_value = None)
newdata = df.DataFrame({'V':df['V'].iloc[::2].values, 'Allele': df['V'].iloc[1::2].values})

问题答案：

str.split与vectoried一起使用expand=True：

In [42]:
df[['V','allele']] = df['V'].str.split('-',expand=True)
df

Out[42]:
      ID    Prob      V allele
0   3009  1.0000  IGHV7   B*01
1    129  1.0000  IGHV7   B*01
2    119  0.8000  IGHV6   A*01
3    120  0.8056   GHV6   A*01
4    121  0.9000  IGHV6   A*01
5    122  0.8050  IGHV6   A*01
6    130  1.0000  IGHV4   L*03
7   3014  1.0000  IGHV4   L*03
8    266  0.9970  IGHV5   A*01
9    849  0.4010  IGHV5   A*04
10   174  1.0000  IGHV6   A*02
11   844  1.0000  IGHV6   A*02

类似资料：

使用由分隔符Java分隔的位置值拆分字符串

我有一个输入字符串，其中包含由分隔符（| |）分隔的4个ID。我使用的代码如下：但有些情况下并非所有ID都存在，如：在上面的场景中，拆分不会分为4个部分，并且无法判断拆分数组中缺少哪个id。有人可以帮助一个有效的解决方案。
使用多个字符串分隔符拆分字符串

如何将过滤器列表拆分为单个过滤器元件？split2String在线程“main”java.util.regex中导致：异常。PatternSyntaxException:索引10或（|和）附近的未闭合组(
如何在java中用'~~'分隔符拆分字符串？

我有输入字符串'~~'作为分隔符。例如：字符串s=“1~~vijay~~25~~pune”；当我在Java中用'~\\~'拆分它时，它工作得很好。还有其他人面临同样的问题吗？请就这个问题发表评论。
将没有分隔符的字符串拆分为列

问题内容：我需要在SQL Server 2012中将一列中的字符串拆分为一个字符，并将每个字符串拆分成它自己的列。例如：如果我有一个栏，我需要把它拆分成，，，，，与每个这些转化为自己列。要拆分的列的长度可能会有所不同，因此我需要使其尽可能地动态。问题答案：您可以这样做：输出：这是动态版本：
仅基于特定分隔符拆分字符串

我正在尝试拆分字段（在某个分隔符“；”）并将结果插入表中。最大值为5个子字符串，由“；”分隔。最多只有5个水果。如果只有水果列，如何拆分字符串以获得单独的水果。如果果数少于5，其余列将返回NA。我首先创建了新列并将其全部设置为null。我尝试了以下代码，但它不起作用，如果水果比列少，其余列将只取最后一个水果的值而不是null。是否还有其他信息可用于拆分字符串？
Python csv：按分隔符将列拆分为列，然后再拆分为行

我在csv文件中有一个列，其中包含此格式的人员详细信息：实际csv格式：我想将它们拆分为一个新的csv文件，如下所示：拆分详细信息：拆分行分隔符：

相关阅读

如何找出哪个行分隔符BufferedReader＃readLine（）用于拆分行？Java 如何使用任何空格字符作为分隔符拆分字符串在Python中将以分号分隔的字符串拆分为字典在Oracle中拆分逗号分隔的值 MySQL拆分逗号分隔的字符串到临时表中

相关文章

Python split()分割字符串方法面试高频手撕题 | 43.将数字每千分位用逗号隔开主成分分析 PCA 分库分表-入门 Linux字符界面调整分辨率

相关问答

Perl使用基于字符串的分隔符拆分字符串 Itext：使用条形码分隔符拆分pdf文档拆分由'['和']'分隔的字符串[重复]如何拆分逗号分隔的字符串？使用不同分隔符的字符串拆分JavaScript[重复]

相关工具

word分词盘古分词 genius中文分词 H.264 分析器 iOS 评分控件

相关文档

分布式 Java 百度分析云使用手册 Stack Overflow 关于 Python 的部分高分问题 Tendermint 源码分析 Java 经验分享