当前位置: 首页 > 知识库问答 >
问题:

在dataframe中查找和替换字符串的Regex[重复]

姬衡
2023-03-14

我正在尝试使用正则表达式替换单词。但不管用。

我试图只替换有一个点的单词(.)

           Names   
   House is cold     
         a.blala     
        myname.s  
  Tables are old      
          L.NAME  
         E. Name
df['Names'] = df['Names'].str.replace(r'([a-z]|[a-z]+)|([A-Z]|[A-Z]+)\..?([a-z]+|[A-Z]+)|([A-Z][a-z]+)', '<person>')
           Names   
   House is cold     
        <person>     
        <person>  
  Tables are old      
        <person>  
        <person>

共有1个答案

麹高远
2023-03-14

我想你可以用:

df['names'] = np.where(df['names'].str.contains('\.'), '<person>',df['names'])
 类似资料:
  • 问题内容: 我得到了这个清单: 我想用一些与之相似的奇异值代替,从而得到一个新的清单: 问题答案: 这些称为列表推导。

  • 如何在spark数据帧中用空字符串替换空字符串。 我尝试了以下方法: 它抛给我一个错误。

  • 问题内容: 我有一个非常大的数据集,想用数字替换字符串。我想对数据集进行操作,而无需为数据集中的每个键(列)键入映射函数。(类似于fillna方法,但用关联值替换特定的字符串)。反正有这样做吗? 这是我的数据集的一个例子 预期结果: 非常差= 1,差= 2,差= 3,好= 4,非常好= 5 //乔纳斯 问题答案: 使用替换

  • 我正在尝试替换一组字符串。xlsx表(约70k行,38列)。我有一个文件中要搜索和替换的字符串列表,格式如下:- 要搜索的单词在左侧,替换词在右侧(查找“bird produk”,替换为“bird product”)。My.xlsx工作表如下所示:- 我正在寻找最快的解决方案,因为我有大约200个单词在列表中要搜索,和。xlsx文件相当大。为此,我需要使用Python,但我愿意接受任何其他更快的解

  • 工作解决方案: 破“解”: 我们将单词字符定义为以下任一项: null null 第一行包含一个整数n,表示句子的数目。后面的每一行都包含一个由非单词字符分隔的单词组成的句子。下一行包含一个整数,表示查询的数量。后续行中的每一行都包含一个要检查的字符串。 制约因素 1≤n≤100 1≤q≤10 作为现有的子字出现时间。 作为悲观主义者的子词出现时间。 作为Optimist的子词出现时间。 whil

  • 问题内容: 我正在使用以下内容以递归方式在目录中搜索特定的字符串,并将其替换为另一个: 这样可以。唯一的问题是,如果字符串不存在,则失败,因为它没有任何参数。这对我来说是个问题,因为我是使用ANT自动运行的,而构建由于失败而失败。 如果找不到该字符串,有没有办法使它失效? 我对我可以使用的单行简单解决方案感兴趣(不一定与或与此类通用unix命令一起使用)。 问题答案: 您可以使用和直接进入,而不是