当前位置: 首页 > 面试题库 >

从字符串中删除特定的单词

毕衡
2023-03-14
问题内容

我正在使用oracle10g

我想删除句子中所有出现的特定单词,但是我不想删除包含z或AZ之间其他字符的任何其他单词。

例如 ,以下是我要删除的句子some

some text, 123 someone, another text some1

预期产量

 text, 123 someone, another text

请注意,some如果该单词包含some+A-Za-z之前或之后的任何其他单词,我也想删除它some

到目前为止,这是我尝试过的:

select replace('some text, 123 someone, another text some1','some','') 
from dual;

我正在输出:

 text, 123 one, another text 1

在上面的输出中,我期望someone不被替换,some1应该完全替换。

我应该如何实现呢?任何建议将不胜感激。

编辑: 为清楚起见,这是我正在寻找的另一个示例

some other text someone other text, someB some1 some.

输出应为:

 other text someone other text, someB

从上面这句话someB是不是删除,因为它具有之间的字符a-z
some1some.被删除becasue它不具有字符之间a-z

编辑2

如果我使用正则表达式:

select REGEXP_REPLACE('some text, 123 someone, another text some1','[^a-zA-Z]','')
from dual

我正在输出:

sometextsomeoneanothertextsome

预期产量:

sometextsomeoneanothertext

请注意,我some1还希望从字符串中删除它,因为它包含的字符不是A-Z

使用regex的答案也将受到赞赏。


问题答案:

由于在正则表达式的Oracle实现中缺少对lookbehind / lookahead和word boundary(\b)的支持,因此似乎不可能在单个REGEXP_REPLACE调用中满足所有要求。特别是针对这种情况,Egor
Skriptunoff指出
:模式匹配,然后是一个接一个的,它们之间只有一个分隔符,例如some some some some ...

如果没有这种情况,则可以通过此调用来匹配所有这样的字符串:

regexp_replace(
  source_string,                                       -- source string
  '([^[:alnum:]]|^)((\d)*some(\d)*)([^[:alnum:]]|$)',  -- pattern
  '\1\5',                                              -- leave separators in place
  1,                                                   -- start from beginning
  0,                                                   -- replace all occurences
  'im'                                                 -- case-insensitive and multiline 
);

图案部分:

(                -- start of Group #1
  [^[:alnum:]]   -- any non-alphanumeric character 
  |              -- or 
  ^              -- start of string or start of line 
)                -- end of Group #1
(                -- start of Group #2
  (              -- start of Group #3 
    \d           -- any digit
  )              -- end of Group #3
  *              -- include in previous group zero or more consecutive digits
  some           -- core string to match
  (              -- start of group #4
    \d           -- any digit
  )              -- end of group #4  
  *              -- include in previous group zero or more consecutive digits
)                -- end of Group #2
(                -- start of Group #5
  [^[:alnum:]]   -- any non-alphanumeric character 
  |              -- or
  $              -- end of string or end of line
)                -- end of Group #5

由于匹配模式中包含的用于匹配的分隔符(第1组和第5组)会在成功匹配时从源字符串中删除,因此我们需要通过在第三个regexp_replace参数中进行指定来恢复此部分。

基于此解决方案,可以替换循环中所有甚至重复的事件。

例如,您可以定义如下函数:

create or replace function delete_str_with_digits(
  pSourceString in varchar2, 
  pReplacePart  in varchar2  -- base string (like 'some' in question)
)
  return varchar2
is
  C_PATTERN_START constant varchar2(100) := '([^[:alnum:]]|^)((\d)*';
  C_PATTERN_END   constant varchar2(100) := '(\d)*)([^[:alnum:]]|$)';

  vPattern         varchar2(4000);
  vCurValue        varchar2(4000);
  vPatternPosition binary_integer;
begin

  vPattern := C_PATTERN_START || pReplacePart || C_PATTERN_END;
  vCurValue := pSourceString;

  vPatternPosition := regexp_instr(vCurValue, vPattern);

  while(vPatternPosition > 0) loop
    vCurValue := regexp_replace(vCurValue, vPattern,'\1\5',1,0,'im');
    vPatternPosition := regexp_instr(vCurValue, vPattern);
  end loop;

  return vCurValue;

end;

并将其与SQL或其他PL / SQL代码一起使用:

SELECT 
  delete_str_with_digits(
    'some text, -> awesome <- 123 someone, 3some3
     line of 7 :> some some some some some some some <
222some  another some1? some22 text 0some000', 
    'some'
  )  as result_string
FROM 
  dual

SQLFiddle example



 类似资料:
  • 我正在通过JSON提取twitter用户的个人资料图像。为此,我的代码是: 返回配置文件图像的url。url的格式可以是或或或等。 现在我想从我收到的每个网址中删除“_normal”部分。如何在php中实现这一点?我厌倦了尝试它。请帮助。

  • 问题内容: 我正在尝试使用Python从字符串中删除特定字符。这是我现在正在使用的代码。不幸的是,它似乎对字符串没有任何作用。 如何正确执行此操作? 问题答案: Python中的字符串是不可变的(无法更改)。因此,的效果只是创建一个新字符串,而不是更改旧字符串。你需要重新绑定(分配)到line该变量,以使该变量采用新值,并删除这些字符。 而且,相对而言,你的操作方式会比较缓慢。这也可能会使经验丰富

  • 问题内容: 我有一个像这样的数组: 我要做的是删除“苹果”。 我的问题很基本,但是,我搜索了网站,发现java并不真正支持从数组中删除功能。我还听说过使用Java Utils,因为删除项目非常简单…。我试图在Google上找到Java Utils,但是几乎所有链接都消失了。 所以最后…有什么方法可以从字符串数组中删除字符串? 即使我使用ArrayList,也找不到在其中生成随机项的方法!例如:在普

  • 问题内容: 我需要从下面的变量值中删除括号“ [”和“]” ,并将结果存储在中。 使用,还是其他? 问题答案: 有几种可用的方法,有时可以使它们执行完全相同的任务,例如preg_replace / str_replace。但是,也许您只想从字符串的开头或结尾删除方括号;在这种情况下,preg_replace有效。但是,如果可能有多个括号,则preg_replace也可以完成这项工作。但是修剪更容易

  • 问题内容: 例如,我正在从文本文件中提取文本String,我需要这些词来形成数组。但是,当我执行所有这些操作时,有些单词以逗号(,)或句号(。)结尾,甚至附有括号(这完全是正常现象)。 我要做的是摆脱那些角色。我一直在尝试使用Java中的预定义String方法来做到这一点,但我还是无法解决。 问题答案: 用: replaceAll采用正则表达式。这个: …寻找每个逗号和/或句号。

  • 问题内容: 我有一个程序可以从Twitter流API实时解析推文。在存储它们之前,我将它们编码为utf8。某些字符最终以?,??或???出现在字符串中 而不是它们各自的unicode代码,并且会引起问题。经过进一步调查,我发现有问题的字符来自“表情符号”块 U + 1F600-U + 1F64F和“其他符号和象形文字”块 U + 1F300-U + 1F5FF。我尝试删除,但未成功,因为匹配器最终