SQL语言艺术(PDF格式)-第3部分

小说： SQL语言艺术(PDF格式) 字数：每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

的设置），而临时表不能。临时表的索引（如果有的话）可能不是最优的，因此，查询临时表的　

语句效率比永久表的差。另外，查询之前必然先为临时表填入数据，这自然也多了一笔额外的　

开销。　

就算使用临时表有充足理由，若数据量大，也绝不能把永久表当作临时工作表来用。问题之一　

在于统计信息的自动收集：若没有实时收集要求，DBMS通常会在不活动或活动少时进行统计　

信息收集，而这时作为临时工作表可能为空，从而使优化器收到了完全错误的信息。这些不正　

确且有偏差的统计信息可能造成执行计划（execution　plan）完全不合理，导致性能下降。所以，　

如果一定要用临时表，应确保数据库知道哪些表是临时的。　

总结：暂时工作表意味着以不太合理的方式存储更多信息。　

　　SQL　

用SSQQLL处理集合　

Set　Processing　in　SQL　

SSeett　PPrroocceessssiinngg　iinn　SSQQLL　

SQL　完全基于集合（Set）来处理数据。对大部分更新或删除操作而言　——　如果不是针对整　

个表的话　——　你必须先精确定义出要处理的记录的集合。这定义了该处理的粒度　

（granularity），可能是对大量记录的粗粒度操作，有可能是只影响少数记录的细粒度操作。　

将一次“大批量数据的处理”分割成多次“小块处理”是个坏主意，除非对数据库的修改太昂贵，　

否则不要使用，因为这种方法极其低效：　

（1）占用过多的空间保存原始数据，以备事务（transaction）回滚（rollback）之需；　

（2）万一修改失败，回滚消耗过长的实践。　

许多人认为，进行大规模修改操作时，应在操作数据的代码中有规律地多安排些mit命令。　

其实，严格从实践角度来讲，“从头开始重做”比“确定失败发生的时间和位置，接着已提交部分　

重做”要容易得多、简单得多、也快得多。　

处理数据时，应适应数据库的物理实现。考虑事务失败时回滚所需日志的大小，如果要为undo　

保存的数据量确实巨大，或许应该考虑数据修改的频率问题。也就是说，将大规模的“每月更新”，　

改为规模不大的“每周更新”，甚至改为规模更小的“每日更新”，或许是个有效方案。　

总结：几千个语句，借助游标（cursor）不断循环，很慢。换成几个语句，处理同样的数据，　

还是较慢。换成一个语句，解决上述问题，最好。　

…………………………………………………………Page　11……………………………………………………………

　　　　　　　　SQL　

动作丰富的SSQQLL语句　

Action…Packed　SQL　Statements　

AAccttiioonn……PPaacckkeedd　SSQQLL　SSttaatteemmeennttss　

SQL　不是过程性语言（procedurallanguage），尽管也可以将过程逻辑（procedurallogic）用于SQL，　

但必须小心。混淆声明性处理（declarative　processing）和过程逻辑，最常见的例子出现在需要　

从数据库中提取数据、然后处理数据、然后再插入到数据库时。在一个程序（或程序中的一个　

函数）接收到特定输入值后，如下情况太常见了：用输入值从数据库中检索到一个或多个另外　

的数据值，然后，借助循环或条件逻辑（通常是　if。。。then　。。。else）将一些语句组织起来，对数　

据库进行操作。大多数情况下，造成上述错误做法的原因有三：根深蒂固的坏习惯、SQL知识　

的缺乏、盲从功能需求规格说明。其实，许多复杂操作往往可由一条　SQL　语句完成。因此，　

如果用户提供了一些数据值，尽量不要将操作分解为多条提取中间结果的语句。　

避免在　SQL　中引入“过程逻辑（procedurallogic）”的主要原因有二。　

数据库访问，总会跨多个软件层，甚至包括网络访问。　

即使没有网络访问，也会涉及进程间通讯；额外的存取访问意味着更多的函数调用、更大的带　

宽，以及更长的等待时间。一旦这些调用要重复多次，其对性能的影响就非常可观了。　

在SQL中引入过程逻辑，意味着性能和维护问题应由你的程序承担。　

大多数据库系统都提供了成熟的算法，来处理join等操作，来优化查询以获得更高的效率。基于　

开销的优化器（cost…basedoptimizer，CBO）是很复杂的软件，它早已不像刚推出时那样没什么　

用了，而在大部分情况下都是非常出色的成熟产品了，优秀的CBO　查询优化的效率极高。然而，　

CBO　所能改变的只有　SQL　语句。如果在一条单独的SQL语句中完成尽可能多的操作，那么性　

能优化可以还由　DBMS　核心负责，你的程序可以充分利用DBMS的所有升级。也就是说，未　

来大部分维护工作从程序间接转移给了DBMS　供货商。　

当然，“避免在　SQL　中引入过程逻辑”规则也有例外。有时过程逻辑确实能加快处理速度，庞　

大的SQL语句未必总是高效。然而，过程逻辑及其之后的处理相同数据的语句，可以编写到一　

个单独的　SQL　语句中，CBO　就是这么做的，从而获得最高效的执行方式。　

总结：尽可能多地把事情交给数据库优化器来处理。　

充分利用每次数据库访问　

Profitable　Database　Accesses　

PPrrooffiittaabbllee　DDaattaabbaassee　AAcccceesssseess　

如果计划逛好几家商店，你会首先决定在每家店买哪些东西。从这一刻起，就要计划按何种顺　

序购物才能少走冤枉路。每逛一家店，计划东西购买完毕，才逛下一家。这是常识，但其中蕴　

含的道理许多数据库应用却不懂得。　

要从一个表中提取多段信息时，采用多次数据库访问的做法非常糟糕，即使多段信息看似“无关”　

（但事实上往往并非如此）。例如，如果需要多个字段的数据，千万不要逐个字段地提取，而应　

…………………………………………………………Page　12……………………………………………………………

一次操作全部完成。　

很不幸，面向对象（OO）的最佳实践提倡为每个属性定义一个get方法。不要把　OO　方法与关　

系数据库处理混为一谈。混淆关系和面向对象的概念，以及将表等同于类、字段等同于属性，　

都是致命的错误。　

总结：在合理范围内，利用每次数据库访问完成尽量多的工作。　

　　　　DBMS　

接近DDBBMMSS核心　

Closeness　to　the　DBMS　Kernel　

CClloosseenneessss　ttoo　tthhee　DDBBMMSS　KKeerrnneell　

代码的执行越接近DBMS　核心，则执行速度越快。数据库真正强大之处就在于此，例如，有些　

数据库管理产品支持扩展，你可以用Ｃ等较底层的语言为它编写新功能。用含有指针操作的底　

层语言有个缺点，即一旦指针处理出错会影响内存。仅影响到一个用户已很糟糕，何况数据库　

服务器（就像“服务器”名字所指的一样）出了问题会影响众多“用户”——服务器内存出了问题，　

所有使用这些数据的无辜的应用程序都会受影响。因此，DBMS　核心采取了负责任的做法，在　

沙箱（sandbox）环境中执行程序代码，这样，即使出了问题也不会影响到数据。例如，Oracle　在　

外部函数（external　function）和它自身之间实现了一套复杂的通信机制，此机制在某些方面很　

像控制数据库连结的方法，以管理两个（或多个）服务器上的数据库实例之间的通信。到底采　

用PL/SQL　存储过程还是外部　C　函数，应综合比较后决定。如果精心编写外部　C　函数获得的　

好处超过了建立外部环境和上下文切换（context…switching）的成本，就应采用外部函数。但需　

要处理一个大数据量的表的每一行时，不要使用外部函数。这需要平衡考虑，解决问题时应完　

全了解备选策略的后果。　

如要使用函数，始终应首选DBMS自带的函数。这不仅仅是为了避免无谓的重复劳动，还因为　

自带函数在执行时比任何第三方开发的代码更接近数据库核心，相应地其效率也会高出许多。　

下面这个简单例子是用　Oracle　SQL编写的，显示了　使用Oracle　函数所获得的效率。假设手工　

输入的文本数据可能包含多个相邻的“空格”，我们需要一个函数将多个空格　

替换为一个空格。如果不采用OracleDatabase　10g　开始提供的正规表达式（regularexpression），　

函数代码将会是这样：　

　　　createor　replace　function　squeeze1（p_string　invarchar2）　

　　　returnvarchar2　

　　　is　

　　　v_stringvarchar2（512）：=''；　

　　　c_char　char（1）；　

　　　n_len　　number　：=length（p_string）；　

　　　i　　　　binary_integer　：=1；　

　　　j　　　　binary_integer；　

　　　begin　

　　　while　（i0）　

　　　　　　　　loop　

　　　　　　　　v_string：=substr（v_string；　1；i）　

　　　　　　　　｜｜ltrim（substr（v_string；　i＋1））；　

　　　　　　　　i：=instr（v_string；　'　'）；　

　　　　　　　　end　loop；　

　　　　　　　　returnv_string；　

　　　　　　　　end；　

　　　　　　　　/　

…………………………………………………………Page　14……………………………………………………………

还有第三种方法：　

　　　　　　　　createor　replace　function　squeeze3（p_string　invarchar2）　

　　　　　　returnvarchar2　

　　　　　　is　

　　　　　　v_stringvarchar2（512）：=p_string；　

　　　　　　len1　　number；　

　　　　　　len2　　number；　

　　　　　　begin　

　　　　　　len1　：=length（p_string）；　

　　　　　　v_string：=replace（p_string；　'　'；''）；　

　　　　　　len2　：=　length（v_string）；　

　　　　　　while　（len2　select　squeeze1（'azeryt　hgfrdt　r'）　

　　　　2　from　dual　

　　　　3　/　

　　　　azeryt　hgfrdtr　

　　　　Elapsed：　00：00：00。00　

　　　　SQL》select　squeeze2（'azeryt　hgfrdt　r'）　

　　　　2　from　dual　

　　　　3　/　

　　　　azeryt　hgfrdtr　

　　　　Elapsed：　00：00：00。01　

　　　　SQL》select　squeeze3（'azeryt　hgfrdt　r'）　

　　　　2　from　dual　

　　　　3　/　

　　　　azeryt　hgfrdtr　

　　　　Elapsed：　00：00：00。00　

…………………………………………………………Page　15……………………………………………………………

那么，如果每天要调用该空格替换操作几千次呢？我们构造一个接近现实负载的环境，下面的　

代码将建立一个用于测试的表并填入随机数据，已检测上面三个函数是否有性能差异：　

　　　createtable　squeezable（random_text　varchar2（50））　

　　　/　

　　　declare　

　　　i　　　　　　binary_integer；　

　　　j　　　　　　binary_integer；　

　　　k　　　　　　　binary_integer；　

　　　v_string　varchar2（50）；　

　　　begin　

　　　foriin1。。10000　

　　　loop　

　　　j：=dbms_random。value（1；　100）；　

　　　v_string：=dbms_random。string（'U'；　50）；　

　　　while　（j

返回目录上一页下一页回到顶部赞（0）踩（0）

第3部分

SQL语言艺术(PDF格式)-第3部分

你可能喜欢的