问题：

在oracle中使用正则表达式在分隔符之间获取文本

商松

2023-03-14

我得到了一个包含在分隔符之间的文本甲骨文。如果可能，请帮助为文本创建正则表达式。我有一个文本示例

12322ABCD124A||!!123!!word1  !!word2!! word3!!||!!789!!word4!!word5  !! word6!!||!!2345  !!word7!!word8!! 890!!||

到目前为止，我只能获取：

||!!123!!word1  !!word2!! word3!!||!!789!!word4!!word5  !! word6!!||!!2345  !!word7!!word8!! 890!!

使用此(\|\|(.*)) ([^\|\|])。

但我需要将这些数据从| |中分离出来，然后从中拆分！！。之后，我需要将其保存到如下数组中：

数组[1]=（123，word1，word2，word3）

数组[2]=（789， word4， word5， word6）

数组[3]=（2345，word7，word8，890）

共有3个答案

潘胤

2023-03-14

您需要按此处所述对分隔符应用两次分割。最后，使用listag再次将值（word）放平，并通过一些字符串连接完成。

我提供了一个包含两个输入记录的完整示例，因此它可以扩展到任何数量的解析行。

您可能需要调整限制拆分次数的T2表。如果您的关键字中可以有NULL值，则还需要一些特殊处理。

查询-评论如下

WITH t1 AS
  (SELECT 1 id,
    '12322ABCD124A||!!123!!word1  !!word2!! word3!!||!!789!!word4!!word5  !! word6!!||!!2345  !!word7!!word8!! 890!!|| ' col
  FROM dual
  UNION ALL
  SELECT 2 id,
    '22222ACCCC12Y||!!567!!word21  !!word22!! word23!!||!!789!!word24!!word25  !! word26!!||!!2345  !!word27!!word28!! 890!!|| ' col
  FROM dual
  ),
  t2 AS
  (SELECT rownum colnum
  FROM dual
    CONNECT BY level < 10
    /* (max) number of columns */
  ),
  t3 AS
  (SELECT t1.id,
    t2.colnum,
    regexp_substr(t1.col,'[^|]+', 1, t2.colnum) col
  FROM t1,
    t2
  WHERE regexp_substr(t1.col, '[^|]+', 1, t2.colnum) IS NOT NULL
  ),
  first_split AS
  ( SELECT id, colnum, col FROM t3 WHERE col LIKE '%!!%'
  ),
  second_split AS
  (SELECT t1.id,
    t1.colnum linenum,
    t2.colnum,
    regexp_substr(t1.col,'[^!]+', 1, t2.colnum) col
  FROM first_split t1,
    t2
  WHERE regexp_substr(t1.col, '[^!]+', 1, t2.colnum) IS NOT NULL
  ),
  agg_values AS
  (SELECT id,
    linenum,
    LISTAGG(col, ',') WITHIN GROUP (
  ORDER BY colnum) val_lst
  FROM second_split
  GROUP BY id,
    linenum
  )
SELECT id,
  'array['
  || row_number() over (partition BY ID order by linenum)
  || ']= ('
  ||val_lst
  ||')' array_text
FROM agg_values
ORDER BY 1,2

按要求产量

    ID ARRAY_TEXT   
     1 array[1]= (123, word1, word2, word3)   
     1 array[2]= (789, word4, word5, word6)      
     1 array[3]= (2345, word7, word8, 890)        
     2 array[1]= (567, word21, word22, word23)        
     2 array[2]= (789, word24, word25, word26)         
     2 array[3]= (2345, word27, word28, 890)

这是第一个_split查询的结果。你把数据分成几行。

ID     COLNUM COL
---------- ---------- ------------------------------------------
1          2 !!123!!word1  !!word2!! word3!!
1          3 !!789!!word4!!word5  !! word6!!
1          4 !!2345  !!word7!!word8!! 890!!
2          2 !!567!!word21  !!word22!! word23!!
2          3 !!789!!word24!!word25  !! word26!!
2          4 !!2345  !!word27!!word28!! 890!!

second_split查询会中断word中的行。

ID    LINENUM     COLNUM COL
---------- ---------- ---------- --------------------------------------------------------------------------------------------------------------------------
1          2          1 123
1          2          2 word1
1          2          3 word2
1          2          4 word3
1          3          1 789
1          3          2 word4
1          3          3 word5
.....

剩下的是LISTAGG来获取csv关键字列表和一个ROW_NUMBER函数来获取漂亮的顺序array_ids

如果要提取单独列中的值，请使用PIVOT而不是listag。缺点是您必须根据实际值数调整查询。

WITH t1 AS
  (SELECT 1 id,
    '12322ABCD124A||!!123!!word1  !!word2!! word3!!||!!789!!word4!!word5  !! word6!!||!!2345  !!word7!!word8!! 890!!|| ' col
  FROM dual
  UNION ALL
  SELECT 2 id,
    '22222ACCCC12Y||!!567!!word21  !!word22!! word23!!||!!789!!word24!!word25  !! word26!!||!!2345  !!word27!!word28!! 890!!|| ' col
  FROM dual
  ),
  t2 AS
  (SELECT rownum colnum
  FROM dual
    CONNECT BY level < 10
    /* (max) number of columns */
  ),
  t3 AS
  (SELECT t1.id,
    t2.colnum,
    regexp_substr(t1.col,'[^|]+', 1, t2.colnum) col
  FROM t1,
    t2
  WHERE regexp_substr(t1.col, '[^|]+', 1, t2.colnum) IS NOT NULL
  ),
  first_split AS
  ( SELECT id, colnum, col FROM t3 WHERE col LIKE '%!!%'
  ),
  --select * from first_split order by 1,2,3;
  second_split AS
  (SELECT t1.id,
    t1.colnum linenum,
    t2.colnum,
    regexp_substr(t1.col,'[^!]+', 1, t2.colnum) col
  FROM first_split t1,
    t2
  WHERE regexp_substr(t1.col, '[^!]+', 1, t2.colnum) IS NOT NULL
  ),
  pivot_values AS
  (SELECT  *
  FROM second_split PIVOT (MAX(col) col FOR (colnum) IN (1 AS "K1", 2 AS "K2", 3 AS "K3", 4 AS "K4"))
  )
SELECT id,
  row_number() over (partition BY ID order by linenum) AS array_id,
  K1_COL,
  K2_COL,
  K3_COL,
  K4_COL
FROM pivot_values
ORDER BY 1,2;

给出了关系视图

ID   ARRAY_ID K1_COL   K2_COL   K3_COL   K4_COL
---------- ---------- -------- -------- -------- --------
1          1 123      word1    word2     word3
1          2 789      word4    word5     word6
1          3 2345     word7    word8     890
2          1 567      word21   word22    word23
2          2 789      word24   word25    word26
2          3 2345     word27   word28    890

嵇俊德

2023-03-14

以下返回预期结果：

with x as 
(select '2322ABCD124A||!!123!!word1  !!word2!! word3!!||!!789!!word4!!word5  !! word6!!||!!2345  !!word7!!word8!! 890!!||' str
 from dual),
 y as (
select regexp_substr(str,'[^||]+[!!]*', 1, level) str from x
    where level > 1
    connect by regexp_substr(str, '[^||]+[!!]*', 1, level) is not null
     )   
 select 
     regexp_replace (
      regexp_replace (
         regexp_replace(str, '^!!', '(') ,
          '!!$', ')'),   
          '[ ]*!![ ]*', ',')  str
   from y

汝楷

2023-03-14

这个应该可以：

with v1 as
(
  select '12322ABCD124A||!!123!!word1  !!word2!! word3!!||!!789!!word4!!word5  !! word6!!||!!2345  !!word7!!word8!! 890!!||' t from dual
)
select level -1 id, trim(',' from regexp_replace(regexp_substr(t,'[^\|]+',1,level),'!!',',')) array from v1
where level > 1
connect by level <= regexp_count(t,'\|\|');

输出：

        ID ARRAY
---------- --------------------------
         1 123,word1  ,word2, word3
         2 789,word4,word5  , word6
         3 2345  ,word7,word8, 890

如果零件数为常数（4）并且您希望它们在单独的列中：

with v1 as
(
      select '12322ABCD124A||!!123!!word1  !!word2!! word3!!||!!789!!word4!!word5  !! word6!!||!!2345  !!word7!!word8!! 890!!||' t from dual
    ), v2 as
    (
    select level -1 id, trim(',' from regexp_replace(regexp_substr(t,'[^\|]+',1,level),'!!',',')) array
    from v1
    where level > 1
    connect by level <= regexp_count(t,'\|\|')
    )
    select id,
    regexp_substr(array,'[^,]+',1,1) val1,
    regexp_substr(array,'[^,]+',1,2) val2,
    regexp_substr(array,'[^,]+',1,3) val3,
    regexp_substr(array,'[^,]+',1,4) val4
    from v2;

输出：

        ID VAL1       VAL2       VAL3       VAL4
---------- ---------- ---------- ---------- ----------
         1 123        word1      word2       word3
         2 789        word4      word5       word6
         3 2345       word7      word8       890

PLSQL样式：

declare 
  type t_text_array is table of varchar2(4000);
  v_text_array t_text_array := t_text_array();
  val varchar2(4000);
  cursor c1 is 
  select '12322ABCD124A||!!123!!word1  !!word2!! word3!!||!!789!!word4!!word5  !! word6!!||!!2345  !!word7!!word8!! 890!!||' t from dual;
begin
  open c1;
  fetch c1 bulk collect into v_text_array;
  for i in 1..v_text_array.count loop
    for j in 2..regexp_count(v_text_array(i),'\|\|') loop
      val := trim(',' from regexp_replace(regexp_substr(v_text_array(i),'[^\|]+',1,j),'!!',','));
      for k in 1..regexp_count(val,',')+1 loop
        --display to console or further process...
        dbms_output.put_line(regexp_substr(val,'[^,]+',1,k));
      end loop;
    end loop;
  end loop;
end;
/

类似资料：

JavaScript正则表达式在花括号之间获取字符串

问题内容：不幸的是，尽管尽我所能记住，每年尝试至少一年学习一次正则表达式，但我却经常忘记，因为我很少使用它们。今年，我新年的决心是不要再尝试学习正则表达式因此，今年，为了避免让我流泪，我将把它交给Stack Overflow_ 。我想以这种格式传递一个字符串，然后返回该字符串。有人能协助我们坚持我的新年决议吗？问题答案：如果您的字符串将始终是该格式，则正则表达式会显得过大：表示以一个字符
使用正则表达式作为StringTokenizer的分隔符
如何在Hibernate / Oracle中使用正则表达式

问题内容：我正在尝试实现一个接受字符串列表的Web服务，每个字符串都是一个正则表达式。需要将这些与数据库的六列进行比较，并且需要返回任何匹配的行。我相信Oracle具有我可以使用的regexp_like（）函数，但是我正在寻找使用Hibernate做到这一点的最佳方法，因此，我不反对持久性引擎。我从这样的东西开始，其中参与者集合包含正则表达式：这是行不通的，因为“输入”不会执行我想要的
Javascript中的正则表达式在日期之间提取和分组字符

我有以下清单：我需要按日期提取和分组，如：我试过使用（\d[/]\d（）），但它只提取如下日期：然后尝试使用<代码>（\/[^:]？.？）进行分组\/ 具有以下结果缺少中间群体我只是喜欢正则表达式，任何heklp都会受到高度赞赏！
Java正则表达式在大括号之间获取数据

问题内容：我正在寻找一个正则表达式来匹配大括号之间的文本。我希望将它们分别作为单独的组。我试过只删除第一个和最后一个大括号。问题答案：您需要围绕要捕获的内容使用捕获组。只是为了匹配并捕获大括号之间的内容。输出量如果要三个特定的匹配组… 输出量
JavaScript拆分正则表达式保留分隔符

使用JavaScript，我试图使用正则表达式将段落拆分为句子。我的正则表达式不考虑括号内的句子，我希望保留分隔符。我在这里放了一个代码示例 jsFiddle.net

在oracle中使用正则表达式在分隔符之间获取文本

共有3个答案

相关问答

相关文章

相关阅读

相关工具

相关文档