当前位置: 首页 > 编程笔记 >

SQL Server多表查询优化方案集锦

陈昂熙
2023-03-14
本文向大家介绍SQL Server多表查询优化方案集锦,包括了SQL Server多表查询优化方案集锦的使用技巧和注意事项,需要的朋友参考一下

SQL Server多表查询的优化方案是本文我们主要要介绍的内容,本文我们给出了优化方案和具体的优化实例,接下来就让我们一起来了解一下这部分内容。

1.执行路径

ORACLE的这个功能大大地提高了SQL的执行性能并节省了内存的使用:我们发现,单表数据的统计比多表统计的速度完全是两个概念.单表统计可能只要0.02秒,但是2张表联合统计就

可能要几十秒了.这是因为ORACLE只对简单的表提供高速缓冲(cache buffering) ,这个功能并不适用于多表连接查询..数据库管理员必须在init.ora中为这个区域设置合适的参数,当这个内存区域越大,就可以保留更多的语句,当然被共享的可能性也就越大了.

2.选择最有效率的表名顺序(记录少的放在后面)

ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,因此FROM子句中写在最后的表(基础表 driving table)将被最先处理. 在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表.当ORACLE处理多个表时, 会运用排序及合并的方式连接它们.首先,扫描第一个表(FROM子句中最后的那个表)并对记录进行派序,然后扫描第二个表(FROM子句中最后第二个表),最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并.

例如:

表 TAB1 16,384 条记录

表 TAB2 1条记录

选择TAB2作为基础表 (最好的方法)

select count(*) from tab1,tab2 执行时间0.96秒

选择TAB2作为基础表 (不佳的方法)

select count(*) from tab2,tab1    执行时间26.09秒

如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表.

例如:    EMP表描述了LOCATION表和CATEGORY表的交集.

SELECT * 
FROM LOCATION L , 
    CATEGORY C, 
    EMP E 
WHERE E.EMP_NO BETWEEN 1000 AND 2000 
AND E.CAT_NO = C.CAT_NO 
AND E.LOCN = L.LOCN 

将比下列SQL更有效率

SELECT * 
FROM EMP E , 
LOCATION L , 
    CATEGORY C 
WHERE  E.CAT_NO = C.CAT_NO 
AND E.LOCN = L.LOCN 
AND E.EMP_NO BETWEEN 1000 AND 2000 

3.WHERE子句中的连接顺序(条件细的放在后面)

ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他WHERE条件之前, 那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾.

例如:

(低效,执行时间156.3秒)

SELECT … 
FROM EMP E 
WHERE  SAL > 50000 
AND   JOB = ‘MANAGER' 
AND   25 < (SELECT COUNT(*) FROM EMP 
WHERE MGR=E.EMPNO); 
(高效,执行时间10.6秒) 
SELECT … 
FROM EMP E 
WHERE 25 < (SELECT COUNT(*) FROM EMP 
       WHERE MGR=E.EMPNO) 
AND   SAL > 50000 
AND   JOB = ‘MANAGER'; 

4.SELECT子句中避免使用'* '

当你想在SELECT子句中列出所有的COLUMN时,使用动态SQL列引用 '*' 是一个方便的方法.不幸的是,这是一个非常低效的方法. 实际上,ORACLE在解析的过程中, 会将'*' 依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 这意味着将耗费更多的时间.

5.减少访问数据库的次数

当执行每条SQL语句时, ORACLE在内部执行了许多工作: 解析SQL语句, 估算索引的利用率, 绑定变量 , 读数据块等等. 由此可见, 减少访问数据库的次数 , 就能实际上减少ORACLE的工作量.

 方法1 (低效)

SELECT EMP_NAME , SALARY , GRADE 
   FROM EMP 
   WHERE EMP_NO = 342; 
   SELECT EMP_NAME , SALARY , GRADE 
   FROM EMP 
   WHERE EMP_NO = 291; 

方法2 (高效)

SELECT A.EMP_NAME , A.SALARY , A.GRADE, 
       B.EMP_NAME , B.SALARY , B.GRADE 
   FROM EMP A,EMP B 
   WHERE A.EMP_NO = 342 
   AND  B.EMP_NO = 291; 

6.删除重复记录

最高效的删除重复记录方法 ( 因为使用了ROWID)

DELETE FROM EMP E 
WHERE E.ROWID > (SELECT MIN(X.ROWID) 
          FROM EMP X 
          WHERE X.EMP_NO = E.EMP_NO); 

7.用TRUNCATE替代DELETE

当删除表中的记录时,在通常情况下, 回滚段(rollback segments ) 用来存放可以被恢复的信息. 如果你没有COMMIT事务,ORACLE会将数据恢复到删除之前的状态(准确地说是恢复到执行删除命令之前的状况),而当运用TRUNCATE时, 回滚段不再存放任何可被恢复的信息.当命令运行后,数据不能被恢复.因此很少的资源被调用,执行时间也会很短.

8.尽量多使用COMMIT

只要有可能,在程序中尽量多使用COMMIT, 这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少:

COMMIT所释放的资源:

a.  回滚段上用于恢复数据的信息.

b.  被程序语句获得的锁

c.  redo log buffer 中的空间

d.  ORACLE为管理上述3种资源中的内部花费(在使用COMMIT时必须要注意到事务的完整性,现实中效率和事务完整性往往是鱼和熊掌不可得兼)

9.减少对表的查询

在含有子查询的SQL语句中,要特别注意减少对表的查询.

例如:

低效:

SELECT TAB_NAME 
      FROM TABLES 
      WHERE TAB_NAME = ( SELECT TAB_NAME 
                 FROM TAB_COLUMNS 
                 WHERE VERSION = 604) 
      AND DB_VER= ( SELECT DB_VER 
              FROM TAB_COLUMNS 
              WHERE VERSION = 604 

高效:

SELECT TAB_NAME 
      FROM TABLES 
      WHERE  (TAB_NAME,DB_VER) 
= ( SELECT TAB_NAME,DB_VER) 
          FROM TAB_COLUMNS 
          WHERE VERSION = 604) 


Update 多个Column 例子:

低效:

UPDATE EMP 
      SET EMP_CAT = (SELECT MAX(CATEGORY) FROM EMP_CATEGORIES), 
        SAL_RANGE = (SELECT MAX(SAL_RANGE) FROM EMP_CATEGORIES) 
      WHERE EMP_DEPT = 0020; 

高效:

UPDATE EMP 
      SET (EMP_CAT, SAL_RANGE) 
= (SELECT MAX(CATEGORY) , MAX(SAL_RANGE) 
FROM EMP_CATEGORIES) 
      WHERE EMP_DEPT = 0020; 

10.用EXISTS替代IN,用NOT EXISTS替代NOT IN

在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下, 使用EXISTS(或NOT EXISTS)通常将提高查询的效率.

低效:

SELECT * 
FROM EMP (基础表) 
WHERE EMPNO > 0 
AND DEPTNO IN (SELECT DEPTNO 
FROM DEPT 
WHERE LOC = ‘MELB') 

高效:

SELECT * 
FROM EMP (基础表) 
WHERE EMPNO > 0 
AND EXISTS (SELECT ‘X' 
FROM DEPT 
WHERE DEPT.DEPTNO = EMP.DEPTNO 
AND LOC = ‘MELB') 

(相对来说,用NOT EXISTS替换NOT IN 将更显著地提高效率)

在子查询中,NOT IN子句将执行一个内部的排序和合并. 无论在哪种情况下,NOT IN都是最低效的 (因为它对子查询中的表执行了一个全表遍历).   为了避免使用NOT IN ,我们可以把它改写成外连接(Outer Joins)或NOT EXISTS.

例如:

SELECT … 
FROM EMP 
WHERE DEPT_NO NOT IN (SELECT DEPT_NO 
             FROM DEPT 
             WHERE DEPT_CAT='A'); 

为了提高效率.改写为:

(方法一: 高效)

SELECT …. 
FROM EMP A,DEPT B 
WHERE A.DEPT_NO = B.DEPT(+) 
AND B.DEPT_NO IS NULL 
AND B.DEPT_CAT(+) = 'A' 

(方法二: 最高效)

SELECT …. 
FROM EMP E 
WHERE NOT EXISTS (SELECT 'X' 
           FROM DEPT D 
           WHERE D.DEPT_NO = E.DEPT_NO 
           AND DEPT_CAT = 'A'); 

当然,最高效率的方法是有表关联.直接两表关系对联的速度是最快的!

11.识别'低效执行'的SQL语句

用下列SQL工具找出低效SQL:

SELECT EXECUTIONS , DISK_READS, BUFFER_GETS, 
     ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio, 
     ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run, 
     SQL_TEXT 
FROM  V$SQLAREA 
WHERE  EXECUTIONS>0 
AND   BUFFER_GETS > 0 
AND (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8 
ORDER BY 4 DESC; 

(虽然目前各种关于SQL优化的图形化工具层出不穷,但是写出自己的SQL工具来解决问题始终是一个最好的方法)

以上就是SQL Server多表查询优化方案的相关知识,希望本次的介绍能够对你有所收获!

 类似资料:
  • 本文向大家介绍MySQL多表链接查询核心优化,包括了MySQL多表链接查询核心优化的使用技巧和注意事项,需要的朋友参考一下 概述 在一般的项目开发中,对数据表的多表查询是必不可少的。而对于存在大量数据量的情况时(例如百万级数据量),我们就需要从数据库的各个方面来进行优化,本文就先从多表查询开始。其他优化操作,后续另外更新,敬请关注。 数据背景 现假设有一个中学学校,学校中的年级有一年级、二年级、三

  • 本文向大家介绍Mysql慢查询优化方法及优化原则,包括了Mysql慢查询优化方法及优化原则的使用技巧和注意事项,需要的朋友参考一下 1、日期大小的比较,传到xml中的日期格式要符合'yyyy-MM-dd',这样才能走索引,如:'yyyy'改为'yyyy-MM-dd','yyyy-MM'改为'yyyy-MM-dd'【这样MYSQL会转换为日期类型】 2、条件语句中无论是等于、还是大于小于,WHERE

  • 问题内容: 我希望从我的用户模型中检索一些信息,如下所示: 在主页中,我有一个 位置 过滤器,您可以在其中浏览来自国家或城市的用户。 所有字段还包含其中的用户数: 在主页上,然后我还有“学生和老师”页面,我希望仅提供有关这些国家和城市有多少老师的信息… 我想做的是创建一个对MongoDB的查询,以通过单个查询检索所有这些信息。 此刻查询如下: 问题是我不知道如何获取所需的所有信息。 我不知道如何获

  • 问题内容: 此查询需要153秒才能运行。中有数百万行。 我认为查询要花很长时间,因为where子句中的功能。但是,我需要在列上执行ltrim rtrim,而且日期也必须在格式上匹配。如何优化此查询? 说明计划: 首要的关键: 索引: 但是,在解释计划中,我看不到使用索引/主键。那是问题吗? 问题答案: 试试这个: 如果尚无时间,请从其外观(出生日期?)上删除该对象。除此之外,您还需要一些索引工作。

  • 本文向大家介绍详解sqlserver查询表索引,包括了详解sqlserver查询表索引的使用技巧和注意事项,需要的朋友参考一下 SELECT   索引名称=a.name  ,表名=c.name  ,索引字段名=d.name  ,索引字段位置=d.colid  需创建索引 例如: 根据某列判断是否有重复记录,如果该列为非主键,则创建索引 根据经常查询的列,创建索引 无须创建索引 字段内容大部分一样,

  • 我有一个需要50秒的查询 security_tasks中的记录=841321 relations中的记录=234254 我能做些什么让它快一点,比如快1秒或2秒 有什么想法吗?