Fork me on GitHub

【SqlServer系列】表单查询

1   概述

已发布【SqlServer系列】文章如下:

如下几个问题,如果你能解决,请继续往下看,若不能解决,请先复习SQL基础知识,再来阅读本篇文章。本篇文章深度中等左右。

Q1:表StudentScores如下,用一条SQL语句查询出每门课都大于80 分的学生姓名

Q2:表DEMO_DELTE如下,删除除了自动编号不同, 其他都相同的学生冗余信息

Q3:Team表如下,甲乙丙丁为四个球队,现在四个球对进行比赛,用一条sql 语句显示所有可能的比赛组合

Q4:请考虑如下SQL语句在Microsoft SQL Server 引擎中的逻辑处理顺序

1 USE TSQLFundamentals2008
2 
3 SELECT empid,YEAR(orderdate) AS orderyear,COUNT(*) numorders
4 FROM Sales.Orders
5 WHERE custid=71
6 GROUP BY empid,YEAR(orderdate)
7 HAVING  COUNT(*)>1
8 ORDER BY empid,orderyear

本篇文章将剖析一般查询过程中,涉及到的处理逻辑子句,主要包括FROM,WHERE,GROUP BY,HAVING,SELECT,ORDER BY,TOP,OVER等子句。

2   SELECT语句的元素

2.1 常规查询子句和逻辑处理顺序

对数据表进行检索查询时,查询语句一般包括FROM,WHERE,GROUP BY,HAVING,SELECT,ORDER BY,TOP,OVER等子句,请考虑如下例子的逻辑处理顺序。

1 USE TSQLFundamentals2008
2 
3 SELECT empid,YEAR(orderdate) AS orderyear,COUNT(*) numorders
4 FROM Sales.Orders
5 WHERE custid=71
6 GROUP BY empid,YEAR(orderdate)
7 HAVING  COUNT(*)>1
8 ORDER BY empid,orderyear

如上代码,在SQL中逻辑处理顺序如下:

USE TSQLFundamentals2008

FROM Sales.Orders
WHERE custid=71
GROUP BY empid,YEAR(orderdate)
HAVING  COUNT(*)>1
SELECT empid,YEAR(orderdate) AS orderyear,COUNT(*) numorders
ORDER BY empid,orderyear

 逻辑处理顺序可归结为如下:

注释:

a.在常规编程语言中,如c++,java,c#等,程序按照“从上往下”的顺序一步一步地执行,然而在SQL中,SELECT语句所处位置虽然在最开始,却不是在最先执行的;

b.逻辑处理顺序的每一步返回的结果集均是紧接着该步语句的下一步语句要执行的结果集;

c.FROM获取数据源(或者数据表),WHERE在FROM基础上过滤条件,GROUP BY在WHERE的基础上按照至少一列对集合进行分组,HAVING在GROUP BY基础上,对已经分组的集合进行过滤,SELECT语句在HAVING基础上检索,ORDER BY在SELECT基础上按照一定条件进行排序;

2.2  部分查询子句讲解

2.2.1   FROM子句

a.用数据库架构在限定代码中的对象名称,即使不用数据库架构限定,Sql Server也会隐式解析它,代价更高,初次之外,如果对象名相同,没有架构限定,会产生歧义;
b.FROM * 性能比 FROM conum_name性能低;
c.FROM查询得到的结果集顺序是随机的;
2.2.2  WHERE子句

a.过滤FROM阶段返回的行;
b.WHERE 谓词或逻辑表达式;
c.WHERE子句对查询性能有重要影响,在过滤表达式基础上,Sql Server会计算使用什么索引来访问请求的数据;
d.扫描整张表,返回所有可能的行,在客户端过滤,开销比较大,如产生大量的网络传输流量;
e.T-SQL使用三值谓词逻辑(true,false,unknown);

2.2.3  GROUP BY子句

a.GROUP BY阶段将上一阶段逻辑查询处理返回的行按“组”进行组合,每个组由在GROUP BY子句中指定的个元素决定;
b.如果查询语句中涉及到分组,那么GROUP BY阶段之后测所有阶段(包括HAVING、SELECT以及ORDER BY)的操作对象将是组,而不是单独的行。每个组最终表示为查询结果集中的一行;
c.GROUP BY阶段之后处理的子句中指定的所有表达式务必保证为每个组只返回一个标量(单值)。以GROUP BY列表中的元素为基础的表达式满足这一要求,因为按照定义,在每个组中GROUP BY元素只唯一出现一次;
d.聚合函数只为每个组返回一个值,所以一个元素如果不再GROUP BY列表中出现,就只能作为聚合函数(COUNT、SUM、AVG、MIN和MAX)的输入。(注意:若有GROUP BY子句,聚合函数只操作具体的每组,而非所有组);
e.所有聚合函数都会忽略NULL,但COUNT(*)除外;
f.在聚合函数中,可以使用distinct来处理非重复数,如count(distinct vary);

2.2.4  HAVING子句

a.HAVING子句用于指定对组进行过滤的谓词或逻辑表达式,这与WHERE阶段对单独的行进行过滤相对应;
b.因为HAVING子句是在对行进行分组后处理的,所以可以在逻辑表达式中引用聚合函数,如 HAVING COUNT(*)>1,意味着HAVING阶段过滤器只保留包含多行的组;

2.2.5  SELECT 子句

a.SELECT子句用于指定需要在查询返回的结果集中包含的属性(列);
b.SELECT子句返回列的名称类型:

  • 直接基于正在查询的表的各个列
  • 三种方式定义别名,推荐使用AS。<表达式>AS<别名>;<别名>=<表达式>(别名 等号 表达式);<表达式> <别名>(表达式 空格 别名)
  • 没有名字的列

c.在关系模型中,所有操作和关系都基于关系代数和关系(集合)中的结果,但在SQL中,情况略有不同,因SELECT查询并不保证返回一个真正的集合(即,由唯一行组成的无序集合)。首先,SQL不要求表必须符合集合条件。SQL表可以没有键,行也不一定具有唯一性,在这些情况下表都不是集合,而是多集(multiset)或包(bag)。但即使正在查询的表具有主键、也符合集合的条件,针对这个表的SELECT查询任然可能返回包含重复的结果。在描述SELECT查询的输出时,经常会使用结果集这个属于,不过,结果集并不一定非得严格满足数学意义上的集合条件;
d.DISTINCT约束,确保行的唯一性,删除重复的行;
e.尽量不用SELECT * 形式查询所有列,而尽量用列明;

2.2.6  ORDER BY

a.理解SQL最重要的一点就是要明白表不保证是有序的,因为表是为了代表一个集合(如果有重复项,则是多集),而集合是无序的。这意味着,如果在查询表时不指定一个ORDER BY子句,那么虽然查询可以返回一个结果表,但SQL Server可以自由地按任意顺序对结果张的行进行排序;
b.在ORDRTB BY中使用ASC代表升序,DESC代表降序,默认情况是升序;
c.带有ORDER BY子句的查询会生成一种ANSI称之为游标(cursor)的结果(一种非关系结果,其中的行具有固定的顺序)。在SQL中的某些语言元素和运算预期只对查询的表结果进行处理,而不能处理游标,如表表达式和集合运算;

3    问题答案

 Q1:KEY

 1 --方法1
 2 select distinct studentName 
 3 from StudentScores
 4 where studentName not in 
 5 (
 6 select distinct studentName 
 7 from StudentScores 
 8 where courseGrades<=80
 9 )
10 
11 --方法2
12 select studentName 
13 from StudentScores 
14 group by studentName 
15 having min(courseGrades)>80

 Q2:KEY

1 DELETE DEMO_DELTE
2 WHERE ID 
3 NOT IN(
4 SELECT min(ID) 
5 FROM DEMO_DELTE_2 
6 GROUP BY xuehao,XM,kcbh,kcmc,fs)

Q3:KEY

1 SELECT team1.TeamName,team2.TeamName
2 FROM Team team1,Team team2
3 WHERE team1.TeamName<team2.TeamName

 Q4:KEY

参照第2章分析。

4  参考文献

【01】Microsoft  SqlServer 2008技术内幕:T-SQL 语言基础

【02】Microsoft  SqlServer 2008技术内幕:T-SQL 查询

【03】程序员的SQL经典

5  版权

 

  • 感谢您的阅读,若有不足之处,欢迎指教,共同学习、共同进步。
  • 博主网址:http://www.cnblogs.com/wangjiming/。
  • 极少部分文章利用读书、参考、引用、抄袭、复制和粘贴等多种方式整合而成的,大部分为原创。
  • 如您喜欢,麻烦推荐一下;如您有新想法,欢迎提出,邮箱:2016177728@qq.com。
  • 可以转载该博客,但必须著名博客来源。
posted @ 2017-07-10 23:40  Alan_beijing  阅读(5882)  评论(3编辑  收藏  举报