当前位置：首页 > 面试题库 >

SQL对数百万行重复删除查询以提高性能

江英卓

2023-03-14

问题内容：

这是一次冒险。我从上一个问题中的循环重复查询开始，但是每个循环将遍历所有
1700万条记录 ， 这意味着将花费数周的时间 （*select count * from MyTable*使用MSSQL
2005，运行服务器需要4:30分钟）。我从这个站点和这个帖子中闪现了信息。

并已经到达下面的查询。问题是，对于任何类型的性能，这是否是对1700万条记录运行的正确查询类型？如果不是，那是什么？

SQL查询：

DELETE tl_acxiomimport.dbo.tblacxiomlistings
WHERE RecordID in 
(SELECT RecordID
    FROM tl_acxiomimport.dbo.tblacxiomlistings
    EXCEPT
    SELECT RecordID
    FROM (
        SELECT RecordID, Rank() over (Partition BY BusinessName, latitude, longitude,           Phone ORDER BY webaddress DESC, caption1 DESC, caption2 DESC ) AS Rank
    FROM tl_acxiomimport.dbo.tblacxiomlistings
    ) al WHERE Rank = 1)

问题答案：

看到QueryPlan会有所帮助。

这可行吗？

SELECT m.*
into #temp
FROM tl_acxiomimport.dbo.tblacxiomlistings m 
inner join (SELECT RecordID, 
                   Rank() over (Partition BY BusinessName, 
                                             latitude,  
                                             longitude,            
                                             Phone  
                                ORDER BY webaddress DESC,  
                                         caption1 DESC,  
                                         caption2 DESC ) AS Rank
              FROM tl_acxiomimport.dbo.tblacxiomlistings
           ) al on (al.RecordID = m.RecordID and al.Rank = 1)

truncate table tl_acxiomimport.dbo.tblacxiomlistings

insert into tl_acxiomimport.dbo.tblacxiomlistings
     select * from #temp

类似资料：

sql删除查询[重复]

当我要执行以下查询时：我得到了错误：消息102，级别15，状态1，第1行“，”附近的语法不正确。编辑：我要删除klantId 3。
SQL查询重复删除帮助

问题内容：我需要从下表中删除半重复记录对于存在的任何重复PID，我想删除最低得分记录。在上面的示例中，将删除ID 1。我试图提出一种不使用循环的方法，但确实很挣扎。任何帮助，将不胜感激。谢谢问题答案：
提高MySQL查询性能-数学重查询

问题内容：有人愿意帮助我吗？在具有10000行的MEMORY表上，以下查询大约需要18秒。如果我没有“ where”约束，则只需不到一分钟的时间。我已经打开查询缓存以及将其作为准备好的语句来尝试。有什么我可以做的吗？索引还是什么？问题答案：我认为这将为您提供所需的信息，而不管您关注的滚动日期范围…我已经通过创建带有两个标识列的自己的“发票”表进行了测试。使用@mySQL变量实际上非常简单，可
在MySQL中删除数百万行

问题内容：我最近发现并修复了我正在处理的站点中的错误，该错误导致表中有数百万行重复的数据行，即使没有行也将非常大（仍然有数百万行）。我可以轻松找到这些重复的行，并可以运行一个删除查询来杀死它们。问题是试图一次删除这么多行会长时间锁定表，如果可能的话，我想避免这种情况。我可以看到摆脱这些行而又不占用站点（通过锁定表）的唯一方法是：编写一个脚本，该脚本将循环执行数千个较小的删除查询。从理论上讲，这
SQL查询-如果重复3次以上，则删除重复项？

问题内容：没有人有一个优雅的sql语句来删除表中的重复记录，但前提是重复项的数量多于x个？因此，最多允许2或3个重复项，仅此而已？当前，我有一条执行以下操作的select语句：这很好用。但是现在，我只想删除那些重复超过2个的行。谢谢问题答案： with cte as ( select row_number() over (partition by dupcol1, dupcol2 ord
优化数百万行的“不在（…）”查询

注意：我无法访问与此问题相关的源代码/数据库。这两个表位于不同的服务器上。我在一家第三方公司工作，该公司的系统与我们自己的系统集成。他们有一个运行类似这样的查询；它在

相关阅读

SQL Server 2008：删除重复的行 SQL：删除重复项如何优化此MySQL查询？数百万行单个查询以删除和显示重复记录 CSS类重复以提高特异性

相关文章

T-SQL删除表 SQL子查询 SQL子查询 JavaScript算法-删除排序数组中的重复项 OrientDB删除属性

相关问答

删除ORACLE中的半重复行SQL 如何在HBase中扫描和删除数百万行 SQL-删除重复列错误[重复]删除查询中找到的所有数据[重复]如何从对象数组中删除属性[重复]

相关工具

高仿消除游戏Dots PHP-ip查询高仿新百度贴吧列表效果丁丁主数据查重工具公交查询系统

相关文档

Java 提高篇 KDB+ 高性能列式数据库中文教程 php-ext-xlswriter 高性能 Excel 扩展 Uragano 高性能 RPC 框架中文文档复杂性思维