SQL：删除重复的记录-尽管是另一种

华和悦

2023-03-14

问题内容：

请考虑下表：

TAB6
         A          B C
---------- ---------- -
         1          2 A
         2          1 A
         2          3 C
         3          4 D

我认为记录{1,2，A}和{2，1，A}是重复的。我需要选择并产生以下记录集：

         A          B C                      A          B C
---------- ---------- -             ---------- ---------- -
         1          2 A         or           2          1 A
         2          3 C                      2          3 C
         3          4 D                      3          4 D

我尝试了以下查询。但无济于事。

select t1.*
from t6 t1
, t6 t2
where t1.a <> t2.b
and t1.b <> t2.a
and t1.rowid <> t2.rowid
/

         A          B C
---------- ---------- -
         1          2 A
         2          1 A
         2          1 A
         2          3 C
         3          4 D
         3          4 D

6 rows selected.

甚至这个：

 select *
 from t6 t1
 where exists (select * from t6 t2 where t1.a <> t2.b and t1.b <> t2.a)
/
         A          B C
---------- ---------- -
         1          2 A
         2          1 A
         2          3 C
         3          4 D

两者都不起作用。

该数据库将为Oracle 10g。寻找纯SQL解决方案。感谢您的帮助。

问题答案：

使用GREATEST（）和LEAST（）函数来识别多个列中的公共值。然后使用DISTINCT清除重复项。

select distinct least(a, b) as a
       , greatest(a, b) as b
       , c
from t6

这样可以为您提供精确的记录集。但是，如果您需要包括T6中的其他列，事情将会变得更加复杂。

“但是我想知道这是否也适用于VARCHAR2字段？”

是的，但是它将使用ASCII值来确定顺序，这并不总是您可能期望的（或期望的）。

“此外，我的表T6可能有数万条记录。”

从今天的角度来看，这确实不是很多数据。该DISTINCT会引起一种，它应该能够装入内存，除非A与B有很长的VARCHAR2列-但可能即使这样。

如果这是您要大量运行的查询，则可以构建基于函数的索引来满足它：

create index t6_fbi on t6(least(a, b)
                           , greatest(a, b)
                           , c )
/

但是，如果您对查询有真正的性能问题，我真的只会打扰。

SQL：删除重复的记录-尽管是另一种

相关阅读

相关文章

相关问答

相关工具

相关文档