MSSQL网站制作之关于SQL SERVER创建索引必要注重的成绩...

只看该作者 · 发表于 2015-1-16 22:25:55

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有帐号？立即注册

x

InnoDB事务型数据库的首选引擎，支持ACID事务，支持行级锁定server|索引|成绩----人们在利用SQL时常常会堕入一个误区，即太存眷于所得的了局是不是准确，而疏忽了分歧的完成办法之间大概存在的
功能差别，这类功能差别在年夜型的或是庞大的数据库情况中（如联机事件处置OLTP或决议撑持体系DSS）中体现得尤其明
显。笔者在事情理论中发明，不良的SQL常常来自于不得当的索引计划、不充份的毗连前提和不成优化的where子句。在对
它们举行得当的优化后，其运转速率有了分明地进步！上面我将从这三个方面分离举行总结：

----为了更直不雅地申明成绩，一切实例中的SQL运转工夫均经由测试，不凌驾１秒的均暗示为（<1秒）。

----测试情况--
----主机：HPLHII
----主频：330MHZ
----内存：128兆
----操纵体系：Operserver5.0.4
----数据库：Sybase11.0.3

1、分歧理的索引计划
----例：表record有620000行，试看在分歧的索引下，上面几个SQL的运转情形：
----1.在date上建有一个非聚集索引

selectcount(*)fromrecordwheredate>19991201anddate<19991214andamount>2000(25秒)
selectdate,sum(amount)fromrecordgroupbydate(55秒)
selectcount(*)fromrecordwheredate>19990901andplacein(BJ,SH)(27秒)

----剖析：
----date上有大批的反复值，在非聚集索引下，数据在物理上随机寄存在数据页上，在局限查找时，必需实行一次表扫描才干找到这一局限内的全体行。

----2.在date上的一个聚集索引

selectcount(*)fromrecordwheredate>19991201anddate<19991214andamount>2000（14秒）
selectdate,sum(amount)fromrecordgroupbydate（28秒）
selectcount(*)fromrecordwheredate>19990901andplacein(BJ,SH)（14秒）

----剖析：
----在聚集索引下，数据在物理上按按次在数据页上，反复值也分列在一同，因此在局限查找时，能够先找到这个局限的起末点，且只在这个局限内扫描数据页，制止了年夜局限扫描，进步了查询速率。

----3.在place，date，amount上的组合索引

selectcount(*)fromrecordwheredate>19991201anddate<19991214andamount>2000（26秒）
selectdate,sum(amount)fromrecordgroupbydate（27秒）
selectcount(*)fromrecordwheredate>19990901andplacein(BJ,SH)（<1秒）

----剖析：
----这是一个不很公道的组合索引，由于它的前导列是place，第一和第二条SQL没有援用place，因而也没有益用上索引；第三个SQL利用了place，且援用的一切列都包括在组合索引中，构成了索引掩盖，以是它的速率长短常快的。

----4.在date，place，amount上的组合索引
selectcount(*)fromrecordwheredate>19991201anddate<19991214andamount>2000(<1秒)
selectdate,sum(amount)fromrecordgroupbydate（11秒）
selectcount(*)fromrecordwheredate>19990901andplacein(BJ,SH)（<1秒）

----剖析：
----这是一个公道的组合索引。它将date作为前导列，使每一个SQL都能够使用索引，而且在第一和第三个SQL中构成了索引掩盖，因此功能到达了最优。

----5.总结：

----缺省情形下创建的索引长短聚集索引，但偶然它并非最好的；公道的索引计划要创建在对各类查询的剖析和展望
上。一样平常来讲：

----①.有大批反复值、且常常有局限查询

（between,>,<，>=,<=）和orderby
、groupby产生的列，可思索创建聚集索引；

----②.常常同时存取多列，且每列都含有反复值可思索创建组合索引；

----③.组合索引要只管使关头查询构成索引掩盖，其前导列必定是利用最频仍的列。

2、不充份的毗连前提：
----例：表card有7896行，在card_no上有一个非会萃索引，表account有191122行，在account_no上有一个非会萃索引，试看在分歧的表毗连前提下，两个SQL的实行情形：

selectsum(a.amount)fromaccounta,cardbwherea.card_no=b.card_no（20秒）

----将SQL改成：
selectsum(a.amount)fromaccounta,cardbwherea.card_no=b.card_noanda.account_no=b.account_no（<1秒）

----剖析：
----在第一个毗连前提下，最好查询计划是将account作外层表，card作内层表，使用card上的索引，其I/O次数可由以下公式预算为：

----外层表account上的22541页+（外层表account的191122行*内层表card上对应外层表第一行所要查找的3页）=595907次I/O

----在第二个毗连前提下，最好查询计划是将card作外层表，account作内层表，使用account上的索引，其I/O次数可由以下公式预算为：

----外层表card上的1944页+（外层表card的7896行*内层表account上对应外层表每行所要查找的4页）=33528次I/O

----可见，只要充份的毗连前提，真实的最好计划才会被实行。

----总结：

----1.多表操纵在被实践实行前，查询优化器会依据毗连前提，列出几组大概的毗连计划并从中找出体系开支最小的最好计划。毗连前提要充份思索带有索引的表、行数多的表；表里表的选择可由公式：外层表中的婚配行数*内层表中每次查找的次数断定，乘积最小为最好计划。

----2.检察实行计划的办法--用setshowplanon，翻开showplan选项，就能够看到毗连按次、利用何种索引的信息；想
看更具体的信息，需用sa脚色实行dbcc(3604,310,302)。

3、不成优化的where子句
----1.例：以下SQL前提语句中的列都建有得当的索引，但实行速率却十分慢：

select*fromrecordwheresubstring(card_no,1,4)=5378(13秒)
select*fromrecordwhereamount/30<1000（11秒）
select*fromrecordwhereconvert(char(10),date,112)=19991201（10秒）

----剖析：
----where子句中对列的任何操纵了局都是在SQL运转时逐列盘算失掉的，因而它不能不举行表搜刮，而没有利用该列下面的索引；假如这些了局在查询编译时就可以失掉，那末就能够被SQL优化器优化，利用索引，制止表搜刮，因而将SQL重写成
上面如许：

select*fromrecordwherecard_nolike5378%（<1秒）
select*fromrecordwhereamount<1000*30（<1秒）
select*fromrecordwheredate=1999/12/01（<1秒）

----你会发明SQL分明快起来！

----2.例：表stuff有200000行，id_no上有非聚集索引，请看上面这个SQL：

selectcount(*)fromstuffwhereid_noin(0,1)（23秒）

----剖析：
----where前提中的in在逻辑上相称于or，以是语法剖析器会将in(0,1)转化为id_no=0orid_no=1来实行。我们希冀它会依据每一个or子句分离查找，再将了局相加，如许能够使用id_no上的索引；但实践上（依据showplan）,它却接纳了"OR战略"，即先掏出满意每一个or子句的行，存进一时数据库的事情表中，再创建独一索引以往失落反复行，最初从这个一时表上钩算了局。因而，实践历程没有益用id_no上索引，而且完成工夫还要受tempdb数据库功能的影响。

----理论证实，表的行数越多，事情表的功能就越差，当stuff有620000行时，实行工夫竟到达220秒！还不如将or子句分
开：

selectcount(*)fromstuffwhereid_no=0
selectcount(*)fromstuffwhereid_no=1

----失掉两个了局，再作一次加法合算。由于每句都利用了索引，实行工夫只要3秒，在620000行下，工夫也只要4秒。大概，用更好的办法，写一个复杂的存储历程：
createproccount_stuffas
declare@aint
declare@bint
declare@cint
declare@dchar(10)
begin
select@a=count(*)fromstuffwhereid_no=0
select@b=count(*)fromstuffwhereid_no=1
end
select@c=@a+@b
select@d=convert(char(10),@c)
print@d

----间接算出了局，实行工夫同下面一样快！
----总结：

----可见，所谓优化即where子句使用了索引，不成优化即产生了表扫描或分外开支。

----1.任何对列的操纵都将招致表扫描，它包含数据库函数、盘算表达式等等，查询时要尽量将操纵移至等号右侧。

----2.in、or子句常会利用事情表，使索引生效；假如不发生大批反复值，能够思索把子句拆开；拆开的子句中应当包括索引。

----3.要擅长利用存储历程，它使SQL变得加倍天真和高效。

----从以上这些例子能够看出，SQL优化的本色就是在了局准确的条件下，用优化器能够辨认的语句，充份使用索引，削减表扫描的I/O次数，只管制止表搜刮的产生。实在SQL的功能优化是一个庞大的历程，上述这些只是在使用条理的一种表现，深切研讨还会触及数据库层的资本设置、收集层的流量把持和操纵体系层的整体计划。
支持AIX、FreeBSD、HP-UX、Linux、MacOS、NovellNetware、OpenBSD、OS/2Wrap、Solaris、Windows等多种操作系统

只看该作者 · 发表于 2015-3-27 16:10:53

对递归类的树遍历很有帮助。个人感觉这个真是太棒了！阅读清晰，非常有时代感。

只看该作者 · 发表于 2015-3-19 07:56:46

你可以简单地认为适合的就是好，不适合就是不好。

只看该作者 · 发表于 2015-3-11 18:45:07

两个月啃那本sqlserver2005技术内部-存储引擎，花了几个月啃四本书

只看该作者 · 发表于 2015-3-4 11:22:24

在select语句中可以使用groupby子句将行划分成较小的组，然后，使用聚组函数返回每一个组的汇总信息，另外，可以使用having子句限制返回的结果集。

只看该作者 · 发表于 2015-2-15 04:25:38

其中最有名的应该是row_number了。这个终于解决了用临时表生成序列号的历史，而且SQLServer2005的row_number比Oracle的更先进。因为它把Orderby集成到了一起，不用像Oracle那样还要用子查询进行封装。

只看该作者 · 发表于 2015-1-29 16:18:15

换言之，只有在不断的失败中尝试成功，而关于失败的总结却是很少的

只看该作者 · 发表于 2015-1-20 19:20:37

同样会为索引视图等应用带来麻烦。看看行级和事务级的快照数据放在tempdb中，就能感觉到目前架构的尴尬。

只看该作者 · 发表于 2015-1-17 13:19:31

微软对CLR作了大篇幅的宣传，这是因为数据库产品终于融入.net体系中。最开始我们也是狂喜，感觉对象数据库的一些概念可以实现了。

		自动登录	找回密码
密码			立即注册

[学习教程] MSSQL网站制作之关于SQL SERVER创建索引必要注重的成绩...

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

相关帖子