Mysql 关联查询

一、先说下查询sql格式

sql格式: select 列名/* from 表名 where 条件 group by 列 having 条件 order by 列 asc/desc;

这里牵涉到一个查询执行顺序的问题.

单表查询执行顺序：

select sex, count(Sex) as count from tch_teacher where id > 15 group by Sex having count > 5 order by Sex asc limit 1;

1-> from 表 : 首先拿到表tch_teacher

2-> where 条件 : 根据where后面的条件筛选一遍数据集合A

3-> group by 分组 : 对筛选出的数据A, 根据group by后面的列进行分组, 得到数据集B

4-> having 筛选 : 对数据集B进行进一步筛选, 得到数据集C

5-> select 数据 : 这里有四步

第一步 : 根据select后面的列名, 去数据集C中取数据. 得到数据集D

第二步 : 对数据集D中的数据进行去重操作(这一步是建立在 sql中有distinct 情况下), 得到数据集E

第三步 : 对数据集E进行排序操作, 得到数据集F

第四步 : 对数据集F进行截取数据操作, 得到最终的数据集(执行 limit 10 操作)

二、多表关联查询

1、cross join 交叉连接 -- 笛卡尔乘积

select * from tch_teacher cross join tch_contact

这种连接方式, 没见人用过. 如果tch_teacher,tch_contact表各有10条数据, 那么连接的结果, 就是 10 x 10 = 100 条数据。

在mysql 中, cross join 后面是可以跟 on 和 where 的, 加上之后, 其实跟 inner join 是一样的。

2、inner join 内连接

内连接在不加on的情况下, 也是去求笛卡尔乘积。不加on的用法并不推荐使用, 容易造成内存溢出的情况. 加on的时候, 在连表的时候, 就会对数据进行筛选, 以此来缩减有效数据范围。

select * from tch_teacher inner join tch_contact

从上面的sql和图片来看, inner join 的时候, 可以不加on, 也能得到一个结果, 而且这个结果和交叉连接的结果是一样的.

这里还有另外两种写法：

select * from tch_teacher,tch_contact

select * from tch_teacher join tch_contact

得到的结果是一样的。

注意：

select * from tch_teacher inner join tch_contact on tch_teacher.Id = tch_contact.TId;

select * from tch_teacher, tch_contact where tch_teacher.Id = tch_contact.TId;

--上面等效。
--on 连接时就做的关联动作,where 是全部关联完以后，再根据条件过滤。
--有说前者比后者执行要快，待验证 TODO

ps:以上图示就是其生成临时表的数据范围。

3、left/right join on 外连接

这里我特意加了一个on在上面, 因为不加on是会报错的.

left join 称之为左连接, 连接以左侧表数据为准, 当右表没有数据与之匹配的时候, 则会用null填补

right join 称之为右连接, 与 left join 相反, 这个是以右表为准

先看下效果吧：

select * from tch_teacher left join tch_contact on tch_teacher.Id = tch_contact.TId;

select * from tch_teacher right join tch_contact on tch_teacher.Id = tch_contact.TId;

ps:以上图示就是其生成临时表的数据范围。

注意：不管是inner join 还是left/right join，当以驱动表去loop遍历另一张表时，如：主从表一对多,(一left/inner join 多),那么重叠的数据，会以多条数据行数为准，主表会冗余行数跟从，要注意数据查重的问题(如果页面主要显示主表数据那么就会有重复)，可先对子表进行关联字段查重处理后的临时表再进行关联查询。

4、full join 全外连接

把两张表的字段都查出来，没有对应的值就显示null，但是注意：mysql是没有全外连接的(mysql中没有full outer join关键字)，想要达到全外连接的效果，可以使用union关键字连接左外连接和右外连接。例如：

select * from tch_teacher left join tch_contact on tch_teacher.Id = tch_contact.TId
UNION 
select * from tch_teacher right join tch_contact on tch_teacher.Id = tch_contact.TId

5、自己连自己

mysql支持一个功能, 就是自己连自己，我再tch_teacher表里面加入一列, CreateBy, 存放的是这个表的Id值。

select a.*, b.Name as CreateByName from tch_teacher a
left join tch_teacher b on a.createby = b.id

能得到以下结果：

三、union查询

除了把几个表通过内部关系拼成一个表结果, 还可以, 把多个表的查询表结果拼成一个表结果. 所使用的方法就是union。

这里要注意的是, 列的顺序. 如果害怕列的顺序不一致不好排查, 可以把表结果的列名都重命名为相同的。

select Id, Sex, BId, `No`, Name, CreateDate from tch_teacher

union

select 0 as Id, Sex, BId, `No`, Name, CreateDate from tch_teacher_temp

union是会对最后的表结果进行去重操作的, 如果我不想去重, 只想快速得到拼接的结果, 可以使用 union all 来拼接。

四、ON 与 WHERE 的区别

很多同学在学习 Mysql 表关联的时候弄不清ON和WHERE的区别，不知道条件应该写在on里面还是where里面，今天简单易懂的总结一下他们的区别，大家共同学习。

这里以left join为例（right join 同理）

on的条件是在连接生成临时表时使用的条件,on后的条件来生成左右表关联的临时表。以左表为基准 ,不管on中的条件真否,都会返回左表中的记录。
where条件是在临时表生成好后,再对临时表过滤。此时和left join(返回左表全部记录)有区别,条件不为真就全部过滤掉,where后的条件是生成临时表后对临时表过滤。

当然如果你使用的是 inner join 则on后条件过滤效果对两边的表都会生效，效果等同于where后跟的过滤条件。

准备工作

我们先准备两个表，并造一些数据：

-- t1
create table t1
(
    id bigint default '0' not null comment '主键id',
    name char(100) default '' not null comment '姓名',
    age int default '0' not null
);
-- t2
create table t2
(
    id bigint default '0' not null comment '主键id',
    goals int default '0' not null comment '进球数',
    matches int default '0' not null comment '比赛编号'
);

探究

口诀：先执行 ON，后执行 WHERE；ON 是建立关联关系，WHERE 是对关联关系的筛选。记住这句话就可以准确地判断查询结果了，我们通过两个 sql 来进行分析：

SELECT t1.id, t1.name, t1.age FROM t1 LEFT JOIN t2 ON t1.id = t2.id WHERE matches = 2; -- 条件放在 WHERE
SELECT t1.id, t1.name, t1.age FROM t1 LEFT JOIN t2 ON t1.id = t2.id AND matches = 2; -- 条件放在 ON

执行第一个 sql 时，前提是 LEFT JOIN，所以左边的数据在创建关联关系时会保留，根据口诀，先执行 ON 建立关联关系，然后通过 WHERE 筛选，过程如下：

第二个 sql 没有 WHERE，那么 ON 建立的关联关系就是最终结果：

注意：

在使用inner join时，不管是对左表还是右表进行筛选，on and和on where都会对生成的临时表进行过滤。on and和on where结果一致。

五、and 与 or优先级

MySQL中，AND的执行优先级高于OR。也就是说，在没有小括号()的干预下，总是先执行AND语句，再执行OR语句。

例：

select * from table where 条件1 AND 条件2 OR 条件3

等价于

select * from table where ( 条件1 AND 条件2 ) OR 条件3

select * from table where 条件1 AND 条件2 OR 条件3 AND 条件4

等价于

select * from table where ( 条件1 AND 条件2 ) OR ( 条件3 AND 条件4 )

如果要把条件2与条件3作为一个整体，需要加括号

select * from table where 条件1 AND (条件2 OR 条件3) AND 条件4

六、其他

1、《阿里巴巴JAVA开发手册》里面写超过三张表禁止join，这是为什么？

　　这个规则超过三张表禁止join ,由于数据量太大的时候，mysql根本查询不出来，导致阿里出了这样一个规定。(其实如果表数据量少，10张表也不成问题,你自己可以试试)而我们公司支付系统朝着大规模高并发目标设计的，所以，遵循这个规定。

　　在业务层面来讲，写简单sql，把更多逻辑放到应用层，我的需求我会更了解，在应用层实现特定的join也容易得多。

参考文章:

https://www.cnblogs.com/elvinle/p/6214894.html

https://www.cnblogs.com/HKUI/p/8536969.html

https://www.jianshu.com/p/d923cf8ae25f

https://www.toutiao.com/i6750800571092959758

posted @ 2019-02-14 22:24 字节悦动阅读(687) 评论(0) 收藏举报

刷新页面返回顶部

北冥有鱼

Mysql 关联查询

一、先说下查询sql格式

二、多表关联查询

1、cross join 交叉连接 -- 笛卡尔乘积

2、inner join 内连接

ps:以上图示就是其生成临时表的数据范围。

3、left/right join on 外连接

ps:以上图示就是其生成临时表的数据范围。

4、full join 全外连接

5、自己连自己

三、union查询

四、ON 与 WHERE 的区别

五、and 与 or优先级

六、其他

公告