SQL优化之针对count、表的连接顺序、条件顺序、
本文详述了SQL优化中针对count、表的连接顺序、条件顺序、in及exist的优化,非常具有实用价值!详述如下
一、关于count
看过一些网上关于count()和count(列)的文章,count(列)的效率一定比count()高吗?
其实个人觉得count()和count(列)根本就没有可比性,count()统计的是表里面的总条数,而count(列)统计的是当列的非空记录条数。
不过我们可以通过实验来比较一下
创建测试表
drop table test purge; create table test as select from dba_objects; update test set object_id =rownum ; set timing on set linesize 1000 set autotrace on
执行
select count() from test; select count(object_id) from test;
发现耗时是一样的,难道他们的效率其实是一样的吗?
我们在列object_id上创建索引试试看
create index idx_object_id on test(object_id);
然后再执行
select count() from test; select count(object_id) from test;
发现count(object_id)的速度明显比count()高出一大截,难道是因为count(object_id)能用到索引,所以效率才提高了很多?
我们再修改下object_id的列属性
alter table test modify object_id not null;
然后再执行
select count() from test; select count(object_id) from test;
发现其实他们的速度是一样快的,count()也可用到索引。
其实效率比较的前提是两个语句的写法要等价,这两种写法根本就不等价,不具有可比性。
对于oracle优化器来说,我们可以通过实验发现,count不同的列,统计的时间是不一样的,大致趋势是列越靠后,访问的开销越大,列的偏移量决定访问的性能。而count()的开销与偏移量无关。,在某些场合count()反而是最快的。
二、关于in和exist
关于in和exist的说法大都是说in的效率比exist高,所以有in的地方必需得换成exist等等。真的是这样的吗?
狼蚁网站SEO优化我们来做个试验
在Oracle 10g中;
select from dept where deptno NOT IN ( select deptno from emp ) ; select from dept where not exists ( select deptno from emp where emp.deptno=dept.deptno) ;
我们发现,exist确实比in的效率高啊。这个说法貌似是成立的啊。
我们再执行狼蚁网站SEO优化的语句
select from dept where deptno NOT IN ( select deptno from emp where deptno is not null) and deptno is not null;
你会发现加上非空的约束条件后,in和exist的效率是一样的。
查看三个语句的执行计划你就会发现,没有加上非空约束的in语句和exist语句走的都是ANTI半连接算法,所以效率是一样的,而未加非空约束的in语句用的是filter,而不是ANTI算法,所以效率就差一些。
所以我们可以得出结论在oracle 10g中,如果可以确保非空,则in约束可以用到ANTI的半连接算法,这时候的效率和exist是一样的。
在Oracle 11g中
select from dept where deptno NOT IN ( select deptno from emp ) ; select from dept where not exists ( select deptno from emp where emp.deptno=dept.deptno) ;
我们发现两个语句的效率是一样的,查看执行计划也是一样的。原来oracle在11g中已经做了优化,所以in和exist的效率是一样的。
由此我们可以得出结论,在11g中,使用in和exist的效率是一样的,因为他们走的都是比较高效的ANTI算法。
三、关于大小表的连接顺序
在网上我们可以看到很多这样的文章,在进行多表查询的时候,用小表或者交叉表做基础表,放在后面,大表放在from后面的位置,因为表的访问顺序是从右往左的。
真的是这样的吗?
我们可以做实验验证一下(此处测试环境为 Oracle 11g)
create table tab_big as select from dba_objects where rownum<=30000; create table tab_small as select from dba_objects where rownum<=10; set autotrace traceonly set linesize 1000 set timing on select count() from tab_big,tab_small ; select count() from tab_small,tab_big ;
我们查看执行计划可以发现,这两个语句的效率是一样的,难道多表查询,表的顺序和效率无关吗?
我们在执行狼蚁网站SEO优化的语句
select /+rule/ count() from tab_big,tab_small ; select /+rule/ count() from tab_small,tab_big ;
我们可以清楚的发现,小表在右,大表在左的语句,查询效率高很多。
其实,在基于规则时代,查询效率是和表的连接顺序相关的,小表或者交叉表在左,大表在右的执行效率会高一些。现在基本上是基于代价的时代,所以大小表的顺序和效率无关,oracle优化器会自动去进行效率优化。
四、where子句中的连接条件顺序
在基于规则时代,oracle采用自下而上的顺序来解析where子句,根据这个原理,我们一般会将可能返回行数最少的表放在面,where子句中有过滤条件的子句放在面。
在现在基于代价时代,这种优化都有oracle优化器帮忙优化了,所以关于表的顺序和条件的顺序已经不会影响我们的查询效率了。
编程语言
- 如何快速学会编程 如何快速学会ug编程
- 免费学编程的app 推荐12个免费学编程的好网站
- 电脑怎么编程:电脑怎么编程网咯游戏菜单图标
- 如何写代码新手教学 如何写代码新手教学手机
- 基础编程入门教程视频 基础编程入门教程视频华
- 编程演示:编程演示浦丰投针过程
- 乐高编程加盟 乐高积木编程加盟
- 跟我学plc编程 plc编程自学入门视频教程
- ug编程成航林总 ug编程实战视频
- 孩子学编程的好处和坏处
- 初学者学编程该从哪里开始 新手学编程从哪里入
- 慢走丝编程 慢走丝编程难学吗
- 国内十强少儿编程机构 中国少儿编程机构十强有
- 成人计算机速成培训班 成人计算机速成培训班办
- 孩子学编程网上课程哪家好 儿童学编程比较好的
- 代码编程教学入门软件 代码编程教程