仓酷云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 1007|回复: 8
打印 上一主题 下一主题

[学习教程] MYSQL网页设计经由过程剖析SQL语句的实行企图优化SQL(二)...

[复制链接]
透明 该用户已被删除
跳转到指定楼层
楼主
发表于 2015-1-16 22:44:11 | 只看该作者 回帖奖励 |正序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
对于现有业务,可以轻松移植到MySQL。当你需要替换掉老的硬件,当你需要削减历史遗留下的老系统的时候,选用MySQL对于财务部门来说更具吸引力。优化|语句|实行第5章ORACLE的实行企图

  背景常识:


  为了更好的举行上面的内容我们必需懂得一些观点性的术语:

  共享sql语句

 为了不反复剖析不异的SQL语句(由于剖析操纵对照费资本,会招致功能下落),在第一次剖析以后,ORACLE将SQL语句及剖析后失掉的实行企图寄存在内存中。这块位于体系全局地区SGA(systemglobalarea)的共享池(sharedbufferpool)中的内存能够被一切的数据库用户共享。因而,当你实行一个SQL语句(偶然被称为一个游标)时,假如该语句和之前的实行过的某一语句完整不异,而且之前实行的该语句与其实行企图仍旧在内存中存在,则ORACLE就不必要再举行剖析,间接失掉该语句的实行路径。ORACLE的这个功效年夜年夜地进步了SQL的实行功能并年夜小节省了内存的利用。利用这个功效的关头是将实行过的语句尽量放到内存中,以是这请求有年夜的共享池(经由过程设置sharedbufferpool参数值)和尽量的利用绑定变量的办法实行SQL语句。

 当你向ORACLE提交一个SQL语句,ORACLE会起首在共享内存中查找是不是有不异的语句。这里必要说明的是,ORACLE对二者接纳的是一种严厉婚配,要告竣共享,SQL语句必需完整不异(包含空格,换行等)。

 上面是判别SQL语句是不是与共享内存中某一SQL不异的步骤:
  1).对所收回语句的文本串举行hashed。假如hash值与已在共享池中SQL语句的hash值不异,则举行第2步:
2)将所收回语句的文本串(包含巨细写、空缺和正文)与在第1步中辨认的一切
已存在的SQL语句比拟较。
比方:
SELECT*FROMempWHEREempno=1000;
和以下每个都分歧
SELECT*fromempWHEREempno=1000;
SELECT*FROMEMPWHEREempno=1000;
SELECT*FROMempWHEREempno=2000;
在下面的语句中列值都是间接SQL语句中的,从此我们将这类sql成为硬编码SQL或字面值SQL

利用绑定变量的SQL语句中必需利用不异的名字的绑定变量(bindvariables),
比方:
a.该2个sql语句被以为不异
selectpin,namefrompeoplewherepin=:blk1.pin;
selectpin,namefrompeoplewherepin=:blk1.pin;
b.该2个sql语句被以为不不异
selectpin,namefrompeoplewherepin=:blk1.ot_ind;
selectpin,namefrompeoplewherepin=:blk1.ov_ind;
从此我们将下面的这类语句称为绑定变量SQL。

3).将所收回语句中触及的工具与第2步中辨认的已存在语句所触及工具比拟较。
比方:
如用户user1与用户user2下都有EMP表,则
用户user1收回的语句:SELECT*FROMEMP;与
用户user2收回的语句:SELECT*FROMEMP;被以为是不不异的语句,
由于两个语句中援用的EMP不是指统一个表。

4).在SQL语句中利用的绑缚变量的绑缚范例必需分歧。

假如语句与以后在共享池中的另外一个语句是同等的话,Oracle其实不对它举行语法剖析。而间接实行该语句,进步了实行效力,由于语法剖析对照泯灭资本。

注重的是,从oracle8i入手下手,新引进了一个CURSOR_SHARING参数,该参数的次要目标就是为懂得决在编程过程当中已大批利用的硬编码SQL成绩。由于在实践开辟中,良多程序职员为了进步开辟速率,而接纳相似上面的开辟办法:
str_sqlstring;
int_empnoint;
int_empno=2000;
str_sql=‘SELECT*FROMempWHEREempno=‘+int_empno;
…………
int_empno=1000;
str_sql=‘SELECT*FROMempWHEREempno=‘+int_empno;

下面的代码实践上利用了硬编码SQL,使我们不克不及利用共享SQL的功效,了局是数据库效力不高。可是从下面的2个语句来看,发生的硬编码SQL只是列值分歧,别的部分都是不异的,假如仅仅由于列值分歧而招致这2个语句不克不及共享是很惋惜的,为懂得决这个成绩,引进了CURSOR_SHARING参数,使这类成绩也能够利用共享SQL,从而使如许的开辟也能够使用共享SQL功效。听起来不错,ORACLE真为用户着想,利用户在不改动代码的情形下还能够使用共享SQL的功效。真的云云吗?天上不会事出有因的失落一个馅饼的,ORACLE对该参数的利用做了申明,倡议在经由实践测试后再改该参数的值(缺省情形下,该参数的值为EXACT,语句完整分歧才利用共享SQL)。由于有大概该变该值后,你的硬编码SQL是可使用共享SQL了,但数据库的功能反而会下落。我在实践使用中已碰到这类情形。以是倡议编写必要不乱运转程序的开辟职员最好仍是一入手下手就利用绑定变量的SQL。

  Rowid的观点:

  rowid是一个伪列,既然是伪列,那末这个列就不是用户界说,而是体系本人给加上的。对每一个表都有一个rowid的伪列,可是表中其实不物理存储ROWID列的值。不外你能够像利用别的列那样利用它,可是不克不及删除改列,也不克不及对该列的值举行修正、拔出。一旦一行数据拔出数据库,则rowid在该行的性命周期内是独一的,即即便该行发生行迁徙,行的rowid也不会改动。

  为何利用ROWID

  rowid对会见一个表中的给定的行供应了最快的会见办法,经由过程ROWID能够间接定位到响应的数据块上,然后将其读到内存。我们创立一个索引时,该索引不仅存储索引列的值,并且也存储索引值所对应的行的ROWID,如许我们经由过程索引疾速找到响应行的ROWID后,经由过程该ROWID,就能够敏捷将数据查询出来。这也就是我们利用索引查询时,速率对照快的缘故原由。

  在ORACLE8之前的版本中,ROWID由FILE、BLOCK、ROWNUMBER组成。跟着oracle8中工具观点的扩大,ROWID产生了变更,ROWID由OBJECT、FILE、BLOCK、ROWNUMBER组成。使用DBMS_ROWID能够将rowid分化成上述的各部分,也能够将上述的各部分构成一个无效的rowid。

  RecursiveSQL观点

  偶然为了实行用户收回的一个sql语句,Oracle必需实行一些分外的语句,我们将这些分外的语句称之为recursivecalls或recursiveSQLstatements。如当一个DDL语句收回后,ORACLE老是隐含的收回一些recursiveSQL语句,来修正数据字典信息,以便用户能够乐成的实行该DDL语句。当必要的数据字典信息没有在共享内存中时,常常会产生Recursivecalls,这些Recursivecalls会将数据字典信息从硬盘读进内存中。用户不比体贴这些recursiveSQL语句的实行情形,在必要的时分,ORACLE会主动的在外部实行这些语句。固然DML语句与SELECT都大概引发recursiveSQL。复杂的说,我们能够将触发器视为recursiveSQL。

  RowSource(行源)

  用在查询中,由上一操纵前往的切合前提的行的汇合,便可所以表的全体行数据的汇合;也能够是表的部分行数据的汇合;也能够为对上2个rowsource举行毗连操纵(如join毗连)后失掉的行数据汇合。

  Predicate(谓词)

  一个查询中的WHERE限定前提

  DrivingTable(驱动表)

  该表又称为外层表(OUTERTABLE)。这个观点用于嵌套与HASH毗连中。假如该rowsource前往较多的行数据,则对一切的后续操纵有负面影响。注重此处固然翻译为驱动表,但实践上翻译为驱动行源(drivingrowsource)更加切实。一样平常说来,是使用查询的限定前提后,前往较少行源的表作为驱动表,以是假如一个年夜表在WHERE前提有无限制前提(如等值限定),则该年夜表作为驱动表也是符合的,以是并非只要较小的表能够作为驱动表,准确说法应当为使用查询的限定前提后,前往较少行源的表作为驱动表。在实行企图中,应当为靠上的谁人rowsource,前面会给出详细申明。在我们前面的形貌中,一样平常将该表称为毗连操纵的rowsource1。

  ProbedTable(被探查表)

  该表又称为内层表(INNERTABLE)。在我们从驱动表中失掉详细一行的数据后,在该表中寻觅切合毗连前提的行。以是该表应该为年夜表(实践上应当为前往较年夜rowsource的表)且响应的列上应当有索引。在我们前面的形貌中,一样平常将该表称为毗连操纵的rowsource2。

  组合索引(concatenatedindex)

  由多个列组成的索引,如createindexidx_emponemp(col1,col2,col3,……),则我们称idx_emp索引为组合索引。在组合索引中有一个主要的观点:引诱列(leadingcolumn),在下面的例子中,col1列为引诱列。当我们举行查询时可使用”wherecol1=?”,也能够利用”wherecol1=?andcol2=?”,如许的限定前提城市利用索引,可是”wherecol2=?”查询就不会利用该索引。以是限定前提中包括先导列时,该限定前提才会利用该组合索引。

  可选择性(selectivity):

  对照一以下中独一键的数目和表中的行数,就能够判别该列的可选择性。假如该列的”独一键的数目/表中的行数”的比值越靠近1,则该列的可选择性越高,该列就越合适创立索引,一样索引的可选择性也越高。在可选择性高的列长进行查询时,前往的数据就较少,对照合适利用索引查询。


有了这些背景常识后就入手下手先容实行企图。为了实行语句,Oracle大概必需完成很多步骤。这些步骤中的每步多是从数据库中物理检索数据行,大概用某种办法筹办数据行,供收回语句的用户利用。Oracle用来实行语句的这些步骤的组合被称之为实行企图。实行企图是SQL优化中最为庞大也是最为关头的部分,只要晓得了ORACLE在外部究竟是怎样实行该SQL语句后,我们才干晓得优化器选择的实行企图是不是为最优的。实行企图关于DBA来讲,就象财政报表关于财政职员一样主要。以是我们面对的成绩次要是:怎样失掉实行企图;怎样剖析实行企图,从而找出影响功能的次要成绩。上面先从剖析树型实行企图入手下手先容,然后先容怎样失掉实行企图,再先容怎样剖析实行企图。

  举例:这个例子显现关于上面SQL语句的实行企图。
SELECTename,job,sal,dname
FROMemp,dept
WHEREemp.deptno=derpt.deptno
ANDNOTEXISTS
(SELECT*
FROMsalgrade
WHEREemp.salBETWEENlosalANDhisal);

  此语句查询薪水不在任何倡议薪水局限内的一切雇员的名字,事情,薪水和部门名。下-1显现了一个实行企图的图形暗示:

  实行企图的步骤

  实行企图的每步前往一组行,它们大概为下一步所利用,大概在最初一步时前往给收回SQL语句的用户或使用。由每步前往的一组行叫做行源(rowsource)。-1树状图显现了从一步到另外一步行数据的活动情形。每步的编号反应了在你察看实行企图时所示步骤的按次(怎样察看实行企图将被冗长地申明)。一样平常来讲这并非每步被实行的前后按次。实行企图的每步大概从数据库中检索行,大概吸收来自一个或多个行源的行数据作为输出:由白色字框指出的步骤从数据库中的数据文件中物理检索数据。这类步骤被称之为存取路径,前面会具体先容在Oracle可使用的存取路径:
l第3步和第6步分离的从EMP表和SALGRADE表读一切的行。
l第5步在PK_DEPTNO索引中查找由步骤3前往的每一个DEPTNO值。它找出与DEPT表中相干联的那些行的ROWID。
l第4步从DEPT表中检索出ROWID为第5步前往的那些行。
由玄色字框指出的步骤外行源上操纵,如做2表之间的联系关系,排序,或过滤等操纵,前面也会给出具体的先容:
l第2步完成嵌套的轮回操纵(相称于C语句中的嵌套轮回),吸收从第3步和第4步来的行源,把来自第3步源的每行与它第4步中响应的行毗连在一同,前往了局行到第1步。
l第1步完成一个过滤器操纵。它吸收来自第2步和第6步的行源,打消失落第2步中来的,在第6步有响应行的那些行,并未来自第2步的剩下的行前往给收回语句的用户或使用。

  完成实行企图步骤的按次

  实行企图中的步骤不是依照它们编号的按次来完成的:Oracle起首完成-1树布局图形里作为叶子呈现的那些步骤(比方步骤3、5、6)。由每步前往的行称为它下一步骤的行源。然后Oracle完成父步骤。

  举例来讲,为了实行-1中的语句,Oracle以以下按次完成这些步骤:
l起首,Oracle完成步骤3,并一行一行地将了局行前往给第2步。
l对第3步前往的每行,Oracle完成这些步骤:
--Oracle完成步骤5,并将了局ROWID前往给第4步。
--Oracle完成步骤4,并将了局行前往给第2步。
--Oracle完成步骤2,将承受来自第3步的一行和来自第4步的一行,并前往给第1步一行。
--Oracle完成步骤6,假如有了局行的话,将它前往给第1步。
--Oracle完成步骤1,假如从步骤6前往行,Oracle未来自第2步的行前往给收回SQL语句的用户。

  注重Oracle对由第3步前往的每行完成步骤5,4,2,6一次。很多父步骤在它们能实行之前只必要来自它们子步骤的单一行。对如许的父步骤来讲,只需从子步骤已前往单一行时当即完成父步骤(大概另有实行企图的其他部分)。假如该父步骤的父步骤一样能够经由过程单一行前往激活的话,那末它也一样被实行。以是,实行能够在树上串连上往,大概包括实行企图的余下部分。关于如许的操纵,可使用first_rows作为优化方针以便于完成疾速呼应用户的哀求。
对每一个由子步骤顺次检索出来的每行,Oracle就完成父步骤及一切串连在一同的步骤一次。对由子步骤前往的每行所触发的父步骤包含表存取,索引存取,嵌套的轮回毗连和过滤器。

有些父步骤在它们被完成之前必要来自子步骤的一切行。对如许的父步骤,直到一切行从子步骤前往之前Oracle不克不及完成该父步骤。如许的父步骤包含排序,排序一兼并的毗连,组功效和总计。关于如许的操纵,不克不及利用first_rows作为优化方针,而能够用all_rows作为优化方针,使该中范例的操纵泯灭的资本起码。

  偶然语句实行时,并非象下面说的那样一步一步有先有后的举行,而是大概并交运行,如在实践情况中,3、5、4步大概并交运行,以便获得更好的效力。从下面的树型图上,是很丢脸出各个操纵实行的前后按次,而经由过程ORACLE天生的另外一种情势的实行企图,则能够很简单的看出哪一个操纵先实行,哪一个后实行,如许的实行企图是我们真正必要的,前面会给出具体申明。如今先来看一些准备常识。

  会见路径(办法)--accesspath

  优化器在构成实行企图时必要做的一个主要选择是怎样从数据库查询出必要的数据。关于SQL语句存取的任何表中的任何行,大概存在很多存取路径(存取办法),经由过程它们能够定位和查询出必要的数据。优化器选择个中自以为是最优化的路径。

  在物理层,oracle读取数据,一次读取的最小单元为数据库块(由多个一连的操纵体系块构成),一次读取的最年夜值由操纵体系一次I/O的最年夜值与multiblock参数配合决意,以是即便只必要一行数据,也是将该行地点的数据库块读进内存。逻辑上,oracle用以下存取办法会见数据:

  1)全表扫描(FullTableScans,FTS)

  为完成全表扫描,Oracle读取表中一切的行,并反省每行是不是满意语句的WHERE限定前提。Oracle按次地读取分派给表的每一个数据块,直到读到表的最高水线处(highwatermark,HWM,标识表的最初一个数据块)。一个多块读操纵可使一次I/O能读取多块数据块(db_block_multiblock_read_count参数设定),而不是只读取一个数据块,这极年夜的削减了I/O总次数,进步了体系的吞吐量,以是使用多块读的办法能够非常高效地完成全表扫描,并且只要在全表扫描的情形下才干利用多块读操纵。在这类会见形式下,每一个数据块只被读一次。因为HWM标识最初一块被读进的数据,而delete操纵不影响HWM值,以是一个表的一切数据被delete后,其全表扫描的工夫不会有改良,一样平常我们必要利用truncate命令来使HWM值回为0。侥幸的是oracle10G后,能够野生压缩HWM的值。

由FTS形式读进的数据被放到高速缓存的LeastRecentlyUsed(LRU)列表的尾部,如许可使其疾速互换出内存,从而不使内存主要的数据被互换出内存。利用FTS的条件前提:在较年夜的表上不倡议利用全表扫描,除非掏出数据的对照多,凌驾总量的5%--10%,或你想利用并行查询功效时。
利用全表扫描的例子:
~~~~~~~~~~~~~~~~~~~~~~~~
SQL>explainplanforselect*fromdual;
QueryPlan
-----------------------------------------
SELECTSTATEMENT[CHOOSE]Cost=
TABLEACCESSFULLDUAL

  2)经由过程ROWID的表存取(TableAccessbyROWID或rowidlookup)

  行的ROWID指出了该行地点的数据文件、数据块和行在该块中的地位,以是经由过程ROWID来存取数据能够疾速定位到方针数据上,是Oracle存取单行数据的最快办法。为了经由过程ROWID存取表,Oracle起首要猎取被选择行的ROWID,大概从语句的WHERE子句中失掉,大概经由过程表的一个或多个索引的索引扫描失掉。Oracle然后以失掉的ROWID为根据定位每一个被选择的行。

  这类存取办法不会用到多块读操纵,一次I/O只能读取一个数据块。我们会常常在实行企图中看到该存取办法,如经由过程索引查询数据。

  利用ROWID存取的办法:
SQL>explainplanforselect*fromdeptwhererowid=AAAAyGAADAAAAATAAF;
QueryPlan
------------------------------------
SELECTSTATEMENT[CHOOSE]Cost=1
TABLEACCESSBYROWIDDEPT[ANALYZED]

  3)索引扫描(IndexScan或indexlookup)

  我们先经由过程index查找到数据对应的rowid值(关于非独一索引大概前往多个rowid值),然后依据rowid间接从表中失掉详细的数据,这类查找体例称为索引扫描或索引查找(indexlookup)。一个rowid独一的暗示一行数据,该行对应的数据块是经由过程一次i/o失掉的,在此情形下该次i/o只会读取一个数据库块。

  在索引中,除存储每一个索引的值外,索引还存储具有此值的行对应的ROWID值。索引扫描能够由2步构成:(1)扫描索引失掉对应的rowid值。(2)经由过程找到的rowid从表中读出详细的数据。每步都是独自的一次I/O,可是关于索引,因为常常利用,尽年夜多半都已CACHE到内存中,以是第1步的I/O常常是逻辑I/O,即数据能够从内存中失掉。可是关于第2步来讲,假如表对照年夜,则其数据不成能全在内存中,以是其I/O很有多是物理I/O,这是一个机器操纵,绝对逻辑I/O来讲,是极为费工夫的。以是假如多年夜表举行索引扫描,掏出的数据假如年夜于总量的5%--10%,利用索引扫描会效力下落良多。
以下列所示:
SQL>explainplanforselectempno,enamefromempwhereempno=10;
QueryPlan
------------------------------------
SELECTSTATEMENT[CHOOSE]Cost=1
TABLEACCESSBYROWIDEMP[ANALYZED]
INDEXUNIQUESCANEMP_I1

  注重TABLEACCESSBYROWIDEMP部分,这标明这不是经由过程FTS存取路径会见数据,而是经由过程rowidlookup存取路径会见数据的。在此例中,所必要的rowid是因为在索引查找empno列的值失掉的,这类体例是INDEXUNIQUESCAN查找,前面赐与先容,EMP_I1为利用的举行索引查找的索引名字。

可是假如查询的数据能全在索引中找到,就能够制止举行第2步操纵,制止了不用要的I/O,此时即便经由过程索引扫描掏出的数据对照多,效力仍是很高的,由于这只会在索引中读取。以是下面我在先容基于划定规矩的优化器时,利用了selectcount(id)fromSWD_BILLDETAILwherecn<6,而没有利用selectcount(cn)fromSWD_BILLDETAILwherecn<6。由于在实践情形中,只查询被索引列的值的情形极其少,以是,假如我在查询中利用count(cn),则不具有代表性。

SQL>explainplanforselectempnofromempwhereempno=10;--只查询empno列值
QueryPlan
------------------------------------
SELECTSTATEMENT[CHOOSE]Cost=1
INDEXUNIQUESCANEMP_I1

进一步讲,假如sql语句中对索引列举行排序,由于索引已事后排序好了,以是在实行企图中不必要再对索引列举行排序
SQL>explainplanforselectempno,enamefromemp
whereempno>7876orderbyempno;
QueryPlan
--------------------------------------------------------------------------------
SELECTSTATEMENT[CHOOSE]Cost=1
TABLEACCESSBYROWIDEMP[ANALYZED]
INDEXRANGESCANEMP_I1[ANALYZED]

  从这个例子中能够看到:由于索引是已排序了的,以是将依照索引的按次查询出切合前提的行,因而制止了进一步排序操纵。


[1][2]下一页

曾经的功能列表可能会迅速变得过时了。而且,有些功能对有的应用程序非常重要,但是对别的应用程序则不一定。
兰色精灵 该用户已被删除
9#
发表于 2015-3-26 22:36:38 | 只看该作者
Mirror可以算是SQLServer的Dataguard了。但是能不能被大伙用起来就不知道了。
海妖 该用户已被删除
8#
发表于 2015-3-19 00:30:22 | 只看该作者
从底层原理到表层引用,书籍多的很。个人认为没有什么那本书好?这样的说法。主要看和个人的学习方法是否适合。
不帅 该用户已被删除
7#
发表于 2015-3-11 14:51:44 | 只看该作者
如果是将来做数据库的开发设计,就应该详细学习T-SQL的各种细节,包括T-SQL的程序设计、存储过程、触发器以及具体使用某个开发语言来访问数据库。
简单生活 该用户已被删除
6#
发表于 2015-3-4 00:21:16 | 只看该作者
以前的DTS轻盈简单。但是现在的SSIS虽然功能强大了很多,但是总是让人感觉太麻烦。看看论坛中询问SSIS的贴子就知道。做的功能太强大了,往往会有很多用户不会用了
飘飘悠悠 该用户已被删除
5#
发表于 2015-2-13 16:52:44 | 只看该作者
再开发调试阶段和OLAP环境中,外键是可以建立的。新版本中加入了SETNULL和SETDEFAULT属性,能够提供能好的级联设置。
莫相离 该用户已被删除
地板
发表于 2015-2-5 21:30:30 | 只看该作者
总感觉自己还是不会SQL
admin 该用户已被删除
板凳
发表于 2015-1-28 12:30:24 | 只看该作者
可能有的朋友会抱怨集成的orderby,其实如果使用ranking函数,Orderby是少不了的。如果担心Orderby会影响效率,可以为orderby的字段建立聚集索引,查询计划会忽略orderby操作(因为本来就是排序的嘛)。
分手快乐 该用户已被删除
沙发
发表于 2015-1-19 21:52:42 | 只看该作者
索引视图2k就有。但是2005对其效率作了一些改进但是schema.viewname的作用域真是太限制了它的应用面。还有一大堆的环境参数和种种限制都让人对它有点却步。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|仓酷云 鄂ICP备14007578号-2

GMT+8, 2024-12-23 01:31

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表