通过在执行计划中删除排序运算符来优化SQL查询

宁卓

2023-03-14

问题内容：

我刚刚开始研究通过索引优化查询，因为SQL数据正在快速增长。我查看了优化器如何通过SSMS中的执行计划处理查询，并注意到正在使用Sort运算符。我听说排序运算符表示查询中的设计不正确，因为可以通过索引过早地进行排序。因此，这是一个示例表和数据，类似于我正在做的事情：

IF OBJECT_ID('dbo.Store') IS NOT NULL DROP TABLE dbo.[Store]
GO

CREATE TABLE dbo.[Store]
(
    [StoreId] int NOT NULL IDENTITY (1, 1),
    [ParentStoreId] int NULL,
    [Type] int NULL,
    [Phone] char(10) NULL,
    PRIMARY KEY ([StoreId])
)

INSERT INTO dbo.[Store] ([ParentStoreId], [Type], [Phone]) VALUES (10, 0, '2223334444')
INSERT INTO dbo.[Store] ([ParentStoreId], [Type], [Phone]) VALUES (10, 0, '3334445555')
INSERT INTO dbo.[Store] ([ParentStoreId], [Type], [Phone]) VALUES (10, 1, '0001112222')
INSERT INTO dbo.[Store] ([ParentStoreId], [Type], [Phone]) VALUES (10, 1, '1112223333')
GO

这是一个示例查询：

SELECT [Phone]
FROM [dbo].[Store]
WHERE [ParentStoreId] = 10
AND ([Type] = 0 OR [Type] = 1)
ORDER BY [Phone]

我创建了一个非聚集索引来帮助加快查询速度：

CREATE NONCLUSTERED INDEX IX_Store ON dbo.[Store]([ParentStoreId], [Type], [Phone])

为了建立IX_Store索引，我从简单的谓词开始

[ParentStoreId] = 10
AND ([Type] = 0 OR [Type] = 1)

然后我[Phone]为ORDER BY添加列并覆盖SELECT输出

因此，即使在建立索引时，优化器仍会使用Sort运算符（而不是索引排序），因为它[Phone]是在AFTER
[ParentStoreId]AND之后进行排序的[Type]。如果我[Type]从索引中删除该列并运行查询：

SELECT [Phone]
FROM [dbo].[Store]
WHERE [ParentStoreId] = 10
--AND ([Type] = 0 OR [Type] = 1)
ORDER BY [Phone]

然后，当然，优化器不使用Sort运算符，因为[Phone]它由排序[ParentStoreId]。

因此，问题是如何创建一个覆盖查询（包括[Type]谓词）并且不让优化器使用排序的索引？

编辑：

我正在使用的表有超过2000万行

问题答案：

首先，您应该验证排序实际上是性能瓶颈。排序的持续时间将取决于要排序的元素的数量，并且特定父存储的存储数量可能很小。（这是假定在应用where子句之后应用了sort运算符）。

我听说排序运算符表示查询中的设计不正确，因为可以通过索引过早地进行排序

太笼统了。通常，可以将排序运算符平移到索引中，并且，如果仅获取结果集的前几行，则可以大大降低查询成本，因为数据库不再需要获取所有匹配的行（并对它们进行排序）全部）以查找第一个，但可以按结果集顺序读取记录，并在找到足够的记录后停止。

在您的情况下，您似乎正在获取整个结果集，因此排序不太可能使情况变得更糟（除非结果集很大）。另外，在您的情况下，构建有用的排序索引可能并不容易，因为where子句包含or。

现在，如果您仍然想摆脱该排序运算符，可以尝试：

SELECT [Phone]
FROM [dbo].[Store]
WHERE [ParentStoreId] = 10
AND [Type] in (0, 1)
ORDER BY [Phone]

或者，您可以尝试以下索引：

CREATE NONCLUSTERED INDEX IX_Store ON dbo.[Store]([ParentStoreId], [Phone], [Type])

尝试让查询优化器ParentStoreId仅对索引范围进行扫描，然后扫描索引中所有匹配的行，如果Type匹配则将其输出。但是，这可能会导致更多的磁盘I
/ O，从而降低查询速度而不是加快查询速度。

编辑：作为最后的手段，您可以使用

SELECT [Phone]
FROM [dbo].[Store]
WHERE [ParentStoreId] = 10
AND [Type] = 0
ORDER BY [Phone]

UNION ALL

SELECT [Phone]
FROM [dbo].[Store]
WHERE [ParentStoreId] = 10
AND [Type] = 1
ORDER BY [Phone]

和

CREATE NONCLUSTERED INDEX IX_Store ON dbo.[Store]([ParentStoreId], [Type], [Phone])

并在应用程序服务器上对这两个列表进行排序，您可以在其中合并（如合并排序）预排序的列表，从而避免进行完整的排序。但这实际上是一个微优化，虽然将排序本身加快了一个数量级，却不太可能对查询的总执行时间产生很大影响，因为我希望瓶颈是网络和磁盘I
/ O，尤其是考虑到由于索引未聚集，磁盘将执行大量随机访问。

通过在执行计划中删除排序运算符来优化SQL查询

相关阅读

相关文章

相关问答

相关工具

相关文档