我在以逗号分隔的列中有以下值。
BHOP23,BHOP23,BHOP24
我想知道值是否在列中重复。
我怎样才能做到这一点?
Oracle安装程序 :
CREATE TABLE your_table ( your_list_column ) AS
SELECT 'a,a,b,c,d' FROM DUAL UNION ALL -- duplicates both at head
SELECT 'a,b,a,c,d' FROM DUAL UNION ALL -- duplicates at head and middle
SELECT 'a,b,c,d,a' FROM DUAL UNION ALL -- duplicates at head and tail
SELECT 'a,b,b,c,d' FROM DUAL UNION ALL -- duplicates at middle and next item
SELECT 'a,b,c,b,d' FROM DUAL UNION ALL -- duplicates at middle and middle
SELECT 'a,b,c,d,b' FROM DUAL UNION ALL -- duplicates at middle and tail
SELECT 'a,b,c,d,d' FROM DUAL UNION ALL -- duplicates both at tail
SELECT 'a,b,a,c,b' FROM DUAL UNION ALL -- two pairs of duplicates
SELECT 'a,b,c,d,e' FROM DUAL; -- no duplicates
要获取具有重复值的列表,可以在正则表达式中使用向后引用:
SELECT *
FROM your_table
WHERE REGEXP_LIKE( ',' || your_list_column || ',', ',([^,]+),(.+,)?\1,' )
输出 :
YOUR_LIST_COLUMN
----------------
a,a,b,c,d
a,b,a,c,d
a,b,c,d,a
a,b,b,c,d
a,b,c,b,d
a,b,c,d,b
a,b,c,d,d
a,b,a,c,b
要获取第一个重复值,您可以提取上述正则表达式的第一个子组:
SELECT your_list_column,
REGEXP_SUBSTR( ',' || your_list_column || ',', ',([^,]+),(.+,)?\1,', 1, 1, NULL, 1 )
AS duplicate_value
FROM your_table
WHERE REGEXP_LIKE( ',' || your_list_column || ',', ',([^,]+),(.+,)?\1,' )
输出 :
YOUR_LIST_COLUMN DUPLICATE VALUE
---------------- ---------------
a,a,b,c,d a
a,b,a,c,d a
a,b,c,d,a a
a,b,b,c,d b
a,b,c,b,d b
a,b,c,d,b b
a,b,c,d,d d
a,b,a,c,b a
然后,要获取唯一值,请使用split_string()
此处定义的函数(但使用用户定义的类型而不是预定义的类型VARRAY
):
CREATE OR REPLACE TYPE stringlist IS TABLE OF VARCHAR2(4000);
/
CREATE OR REPLACE FUNCTION split_String(
i_str IN VARCHAR2,
i_delim IN VARCHAR2 DEFAULT ','
) RETURN stringlist DETERMINISTIC
AS
p_result stringlist := stringlist();
p_start NUMBER(5) := 1;
p_end NUMBER(5);
c_len CONSTANT NUMBER(5) := LENGTH( i_str );
c_ld CONSTANT NUMBER(5) := LENGTH( i_delim );
BEGIN
IF c_len > 0 THEN
p_end := INSTR( i_str, i_delim, p_start );
WHILE p_end > 0 LOOP
p_result.EXTEND;
p_result( p_result.COUNT ) := SUBSTR( i_str, p_start, p_end - p_start );
p_start := p_end + c_ld;
p_end := INSTR( i_str, i_delim, p_start );
END LOOP;
IF p_start <= c_len + 1 THEN
p_result.EXTEND;
p_result( p_result.COUNT ) := SUBSTR( i_str, p_start, c_len - p_start + 1 );
END IF;
END IF;
RETURN p_result;
END;
/
然后,您可以将其与SET()
收集功能结合使用:
SELECT t.*,
(
SELECT LISTAGG( COLUMN_VALUE, ',' ) WITHIN GROUP ( ORDER BY ROWNUM )
FROM TABLE( SET( split_string( t.your_list_column ) ) )
) AS unique_list
FROM your_table t
输出 :
YOUR_LIST_COLUMN UNIQUE_LIST
---------------- ---------------
a,a,b,c,d a,b,c,d
a,b,a,c,d a,b,c,d
a,b,c,d,a a,b,c,d
a,b,b,c,d a,b,c,d
a,b,c,b,d a,b,c,d
a,b,c,d,b a,b,c,d
a,b,c,d,d a,b,c,d
a,b,a,c,b a,b,c
a,b,c,d,e a,b,c,d,e
问题内容: 是否可以使用python获取哪些值在列表中重复? 我有一个项目清单: 我知道删除重复项的最佳方法是,但是是否可以知道正在重复哪些值?如您所见,在此列表中,重复项是第一个和最后一个值。。 是否有可能获得此结果或python中类似的东西?我正在努力避免做出荒谬的大条件声明。 问题答案: 这些答案是O(n),因此比使用的代码多一点,但随着时间的延长,效率会大大提高 如果您只想知道重复项,请使
问题内容: 我有这样一个简单的数据框: 看起来像这样: 我只想在行之间用字符“ 0”替换重复的字符。归结为保留我们遇到的第一个重复值,如下所示: 这看起来很简单,但是我被卡住了。任何朝着正确方向前进的人都会受到感激。 问题答案: 您可以使用该方法返回一个布尔索引器,该索引器确定元素是否重复: 然后,您可以通过在数据框的各行之间映射此掩码并使用其进行替换来创建掩码:
如果一列存在于两个数据帧之间,我想删除它。我检查它是否存在,然后尝试删除它,但它说找不到。 错误:
我试图使用它们的共同点将两个表连接在一起,但是我一直在找不到特定的列,我可以清楚地看到该列在那里。
我正在使用一个警报对话框,显示一个菜单在应用程序的开始,我想要对话框显示我的两个值,是“名称”从一个对象,这里是警报对话框的代码: 是包含字符串“name”的对象,包含数组
我需要从一个列表中追加一些重复的值到一个子列表中,让我用一个例子来解释: 我有一个名为的变量,它包含大写字母字符串和符号。 我的最终目标是拥有这个数组: 在示例中,我需要将所有的符号分组到原始中的子列表中,我想过在数组中迭代,找到当前附近的所有符号,然后创建第二个数组,但我想也许还有更多的pythonic我可以做的,有什么想法吗?