在SQL Server 中负责生成实际工作计划(执行计划)的组件是查询优化器,以何种顺序访问表、使用哪种访问方法和哪个索引、应用哪种联接算法等都是由优化器来决定的。优化器会生成多个有效的执行计划,并选择其中成本最低的执行计划。
明确的区分查询的逻辑处理和物理处理是非常有必要的。
逻辑查询中的各个阶段
代码清单1-1
(8)SELECT (9) DISTINCT (11) <TOP_specification> <select_list>
(1)FROM <left_table>
(3) <join_type> JOIN <right_table>
(2) on <join_condition>
(4)WHERE <where_condition>
(5)GROUP BY <group_by_list>
(6)WITH {CUBE | ROLLUP}
(7)HAVING <having_condition>
(10)ORDER BY <order_by_list>
SQL不同于与其他编程语言的最明显特征是处理代码的顺序。在大多数编程语言中,代码按编码顺序被处理,但在SQL语言中,第一个被处理的子句是FROM子句,尽管SELECT语句第一个出现,但几乎总是在最后被处理。
每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入。这些虚拟表对调用者(客户端应用程序或者外部查询)不可用。只有最有一步生成的表才会返回给调用者。如果没有在查询中指定某一子句,将跳过相应的步骤。
逻辑查询处理阶段简介
1.FROM:对From子句中的前两表执行笛卡尔积(Cartesian Product)(交叉连接),生成虚拟表VT1.
2.ON:对VT1应用ON筛选器,只有那些使<join_condition>为真的行才被插入VT2.
3.OUTER(JOIN):如果指定了OUTER JOIN,保留表(preserved table)中未找到匹配的行将作为外部行添加到VT2,生成T3。如果FROM子句包含两个以上的表,则对上一个联接生成的结果表和下一个表重复执行步骤1到步骤3,知道处理完所有的表为止。
4.WHERE:对VT3应用WHERE筛选器。只有使用<where_condition>为TRUE的行才被插入到VT4.
5.GROUP BY:按GROUP BY子句中的列列表对VT4进行分组,生成VT5.
6.CUBE|ROLLUP:把超组(SupperGroups)插入到VT5,生成VT6。
7.HAVING:对VT6应用HAVING筛选器。只有使<having_condition>为TRUE的组才会被插入到VT7.
8.SELECT:处理SELECT列表,生成VT8。
9.DISTINCT:将重复行从VT8中移除,产生VT9。
10.ORDER BY:将VT9中的行按ORDER BY子句中的列列表排序,生成一个游标(VC10)
11.TOP:从VC10的开始出选择指定数量或比例的行,生成VT11,并返回给调用者。