数据库基本知识

Mysql数据库的使用

前言:在本科阶段也开设过这一堂课,但是老师的重点似乎只放在了书写简单的sql语句上,而对一些重要的

基本的东西提及较少,因此通过这次梳理一遍基础知识。便于对数据库进行更加合理的设计与理解。

 

sql(程序员用于查询的语句)的分类:

DQL(data Query Language):数据查询语言(凡是带有select关键字的都是查询语句)

DML(Data Manipulation Language):数据操作语言(凡是对表中的数据进行增删改的都是DML)

DDL(Data Definition Language):数据定义语言 凡是带有create,drop,alter的都是DDL 。DDL主要操作的是表的结构,不是表中的数据。

create :新建,等同于增

drop:删除

alter:修改

TCL(Transactional Control Language):事务控制语言 包括事务提交(commit) 事务回滚:rollback

DCL(Data Control Language):数据控制语言:授权grant,撤销权限revoke。  

 

查询所有的字段:

select * from tablename;

这种方式的缺点 :

1、效率低

2、可读性差  在实际开发中不建议 因为*会转换为表中的其他字段

 

在mysql中的大小写没有影响,字段的名称的大小写也没有影响。

给查询的列起别名 :通过as进行别名的设置,这个别名并不是修改原来表的名字,只是设置查询结果的名字

其中:as可以省略用空格代替 。若是别名中有空格需要给别名添加单引号或者双引号。

注意:在所有的数据库当中,字符串一般统一使用单引号括起来,单引号是标准,双引号在oracle数据库中用不了。但是在mysql中是可以使用的。

字段可以使用数学表达式。(可以使用加减乘除)

如果别名是中文需要用引号括起来 //新版已经不需要

 

条件查询:

1、不等于有两种:!=或者<>

2、位于两个之间使用between and 要求左小右大(是闭区间)  

3、is null 用于判断是否为空,不能用=null判断

因 为数据库中的null代表什么也没有,它不是一个值,所以不能用等号衡量。

is not null 用于判断不为空字段。

4、and 和

      or 或者

如果and和or同时出现,需要时刻注意语义的问题,因为and的优先级大于or的优先级。因此需要根据语义添加小括号。

 在开发中如果不确定优先级就加小括号即可。

5、in 包含,相当于多个or 类似于集合,但并不是区间。如果在区间里面使用between and

不在集合里面使用not in    如果not in里面有空则不能正确判断,但是in里面可以。

6、like 模糊查询 支持匹配%和下划线匹配 

    %匹配任意个字符 下划线_一个下划线只匹配一个字符。

tips:如果要找出字段中有_的,不能直接使用"%_%",需要使用转义字符进行转义 通过"%\_%"即可。

 

排序:

使用order by 进行排序,默认升序 asc  如果需要指定降序要使用desc来指定。

多条件排序在之后用逗号隔开即可,而且前面的条件占主导的地位,后面的排序是根据前面条件的相等的情况服务的,因此若是之前条件的字段没有相等的就不会进行排序。

 

数据处理函数

数据处理函数又被称为单行处理函数。

单行处理函数的特点:一个输入对应一个输出

和单行处理函数相对的是:多行处理函数。(多个输入对应一个输出)

 

常见的单行处理函数:

1、lower转换小写。

2、upper转换大写。

3、substr 取子串(substr(被截取的字符串,起始下标,截取的长度)) 起始的下标是从1开始而不是从零开始。

4、concat 拼接函数。

5、length 字段长度函数。

6、trim 去空格(只能去除前后不能够去除中间的空格)

7、str_to_data 将字符串转换成日期

8、date_format 格式化日期

9、format 设置千分位

10、round 四舍五入       

注意:如果select 后面跟上一个字面量,那么会依照表的结构用常量填充该表。(因为在表中无法找到相应的字段)

11、rand()生成随机数。生成100以内的随机数 select round(rand()*100,0) from 表;

12、ifnull 空处理函数 

注意:在所有的数据库当中,NULL只要参与运算,最终结果一定为NULL。为了避免这个现象,需要

使用ifnull函数。ifnull函数用法:ifnull(数据,被当作哪个值)

如果数据为null的时候,把这个数据结构当做哪个值。

13、case ..when..then..when..then..else..end

需求背景:只计算出相应的条件修改后的值,而不修改原表中的内容。

匹配某个字段,当某个条件时执行某项行为。

 

分组函数(多行处理函数)

多行处理函数的特点:输入多行,最终输出一行

5个:

  count 计数

  sum求和

  avg 平均值

  max 最大值

  min 最小值

注意 分组函数在使用前必须先进行分组,然后才能用。

  如果没有对数据进行分组,整张表默认为一组。

分组函数在使用的时候需要注意:  

第一点:分组函数自动忽略NULL,不需要提前对NULL进行处理。

第二点:分组函数中count(*)和count(具体字段)有什么区别

count(具体字段):表示统计该字段下所有不为NULL的元素的总数

count(*):统计表当中的总行数。(只要有一行数据count则++)

第三点:分组函数不能够直接使用在where子句中。

第四点:所有的分组函数可以组合起来一起用。

 

分组查询

什么是分组查询:在实际的应用中,可能有这样的需求,需要先进行分组,然后对每一组的数据进行操作。

这个时候我们需要使用分组查询,怎么进行分组查询呢?

select ...from ...group by ...

计算每个部门的工资和?

计算每个工作岗位的平均薪资

提出每个工作岗位的最高薪资。

 

多个关键字查询的顺序:

select 。。。from 。。。where 。。group by 。。order by 。。

执行顺序如下:

1、from

2、where 

3、group by 

4、select

5、order by

为什么分组函数不能直接用在where的后面。

因为分组函数是必须要进行分组才可以使用的。

在where执行的时候,还没有进行分组。所以where后面不能出现分组函数。

重点结论:在一条select语句当中,如果有group by 语句的话,select后面只能跟:参加分组的字段,以

及分组函数。其他的一律不跟。因为无意义,而且在Oacle等数据库中会报错。

可以根据多个字段分组,相当于将两个字段看成一个字段进行新的分组。(字段间用逗号链接)

例如select  deptno,job,max(sal) from emp group by deptno,job;

 

使用having可以对分完组之后的数据进行下一步的过滤。having不能单独使用,having不能代替where,

having必须和group by 联合使用。

 优化策略:where和having优先选择where,where实在完成不了再选择having 

 

大总结(单表查询)

select 。。。 from。。。where。。。group by 。。。having。。。order by。。。

以上关键字只能按照这个顺序来,不能颠倒

执行顺序:

1、from

2、where 

3、group by 

4、having

5、select

6、order by

从某张表中查询数据,先经过where条件筛选出有价值的数据。对这些有价值的数据进行分组。分组之后可以使用having继续筛选。select查询出来,最后排序输出。

 

去除重复记录:

通过distinct用于去除重复的记录。distinct必须紧跟select才有意义。如果distinct后面紧跟多个字段,则是这些字段联合起来再进行去重,还可以通过count(distinct 字段名)进行计算去重后的数量。

 

连接查询

什么是连接查询:从一张表中单独查询,称为单表查询。

emp表和dept表联合起来查询数据,从emp表中取员工名字,从dept表中取部门名字。

这种跨表查询,多张表联合起来查询数据,被称为连接查询。

 

连接查询的分类:

根据语法的年代分类:

SQL92:1992年的时候出现的语法。

SQL99:1999年的时候出现的语法。

这里重点学习SQL99.

 

根据表连接的方式分类:

内连接:

  等值连接

  非等值连接

  自连接

外连接:

  左外连接(左连接)

  右外连接(右连接)

全连接:

 

当两张表进行连接查询,没有任何条件限制的时候,最终查询结果条数,是两张表条数的乘积,

这种现象被称为:笛卡尔积现象。

  怎么避免笛卡尔积现象

连接时加条件,满足这个条件的记录被筛选出来!

思考:最终查询的结果条数是14条记录,但是匹配的过程中,匹配的次数减少了吗?

还是56次,只不过进行了四选一。次数没有减少。

注意:通过笛卡尔积现象得出,表的连接次数越多效率越低,尽量避免表的连接次数。

 

内连接之等值连接

案例:查询每个员工所在部门名称,显示员工名和部门名

emp e 和dept d表进行连接,条件是:e.deptno = d.deptno

SQL92语法:

  select e.ename,d.dname from emp e ,dept d where e.deptno = d.deptno;

SQL92 的缺点:结构不清晰,表的连接条件,和后期进一步筛选的条件,都放到了where后面。

 

SQL99语法:

  select e.ename,d.dname from emp e join dept d on e.deptno = d.deptno where ...;

SQL99优点: 表连接的条件是独立的,连接之后,如果还需要继续进一步筛选,再往后继续添加where。

join 前面的inner 可以省略,不省略的话能够更清晰地看出来是内连接。因为连接条件是值相等,所以被叫做等值连接。

 

内连接之非等值连接

找出每个员工的薪资等级,要求显示员工名,薪资,薪资等级。

 select e.ename,e.sal,s.grade from emp e join salgrade s on e.sal between s.losal and s.hisal ;

因为连接的条件不是一个等量关系,因此叫做非等值连接。

 

内连接之自连接

案例:查询员工的上级领导,要求显示员工名和对应的领导名。

 select e.empno,e.ename,s.ename from emp e join emp s on e.mgr = s.empno;

技巧:将一张表看作成两张表

 

外连接

内连接的特点:完成能够匹配连接条件的数据查询出来(A和B连接,AB两张表没有主次关系。平等的)

右外连接:

select e.ename,d.dname from emp e right join dept d on e.deptno = d.deptno;

right代表什么:表示将join关键字右边的这张表看成主表,主要是为了将这张表的数据全部查询出来,捎带着关联查询左边的表。

在外连接中,两张表连接,产生了主次关系。

 

左外连接:

select e.ename,d.dname from emp e left join dept d on e.deptno = d.deptno;

 

带有right的是右外连接,又叫做右连接

带有left的是左外连接,又叫做左连接

任何一个右连接都有左连接的写法

任何一个左连接都有右连接的写法

在join前面可以加outer,但是outer是可以省略的。带着可读性强。

 

思考:外连接的查询结果条数一定是>=内连接的查询结果条数?

正确

 

案例:查询每个员工的上级领导,要求显示所有员工的名字和领导名。

 select e.ename,s.ename from emp e left join emp s on e.mgr=s.empno;

 

注意:啥时候使用内连接?啥时候使用外连接?

如果两张表是公平的,想得到的数据只是符合条件能够查询出来的就使用内连接。

如果两张表是不公平的,有主次之分,想在把一张表的所有数据取出来的前提下再附带将符合条件的另外一张表的数据取出来就使用外连接。

全连接:full outer 就是将两张表都当作主表。

 

三张表,四张表怎么连接?

语法:select 。。。from a join b on a和b的连接条件 join c on a和c的连接条件  join d on a和d的连接条件

一条SQL中内连接和外连接可以混合。都可以出现

案例:找出每个员工的部门名称以及工资等级,要求显示员工名、部门名、薪资、薪资等级。

select e.ename,e.sal,d.dname,s.grade from emp e join dept d on e.deptno = d.deptno join salgrade s on e.sal between s.losal and s.hisal;(其中两个内连接,一个等值连接,一个非等值连接)

 

案例升级:找出每个员工的部门名称以及工资等级,还有上级领导,要求显示员工名、领导名、部门名、薪资、薪资等级。

 select e.ename,e.sal,g.ename,d.dname,salgrade.grade from emp e left join emp g on e.mgr = g.empno join dept d on e.deptno = d.deptno join salgrade on e.sal between salgrade.losal and salgrade.hisal;

(其中一个自左外连接,两个内连接)。

 

子查询?

什么是子查询?

  select语句中嵌套select语句,被嵌套的select语句被称为子查询。

子查询都可以出现在哪里呢?

select

。。。(select)

from

。。。(select)

where

。。。(select)

 

where字句中的子查询

案例:找出比最低工资高的员工姓名和工资?

 select ename,sal from emp where sal>min(sal);

ERROR 1111 (HY000): Invalid use of group function

where子句中不能直接使用分组函数。

实现思路:

第一步:查询最低工资是多少

select min(sal) from emp ;

第二步:找出>800的

select ename,sal from emp where sal >800;

第三步:合并

select ename,sal from emp where sal >(select min(sal) from emp);

 

from子句中的子查询

注意:from后面的子查询,可以将子查询的查询结果当作是一张临时表。(技巧)

案例:找出每个岗位的平均薪资的薪资等级。

第一步:找出每个岗位的平均工资(按照岗位分组求平均值)

  select job,avg(sal) from emp group by job;  当作t表

第二步:克服心理障碍,把以上的查询结果就当作是一张真实存在的表。

表和函数都需要取别名,不然没有办法使用。

 select t.*,s.grade from (select job,avg(sal) newsal from emp group by job) t join salgrade s on t.newsal between s.losal and s.hisal order by s.grade desc;

 

select后面出现的子查询(这个内容不需要掌握,了解即可!!!)

案例:找出每个员工的部门名称。

select e.ename,e.deptno,(select dname from dept d where e.deptno =d.deptno) from emp e;

 

注意:对于select后面的子查询来说,这个子查询只能返回一条结果,多于一条就报错。

 

union合并查询结果集

案例:查询工作岗位是MANAGER和SALESMAN的员工?

select ename,job from emp where job = 'MANAGER' or job = 'SALESMAN';

select ename,job from emp where job in ( 'MANAGER','SALESMAN');

select ename,job from emp where job = 'MANAGER'

union

select ename,job from emp where job = 'SALESMAN' ;

union的效率要高一些。对于表连接来说,每连接一次新表,则匹配的次数满足笛卡尔积,成倍的翻。。。

但是union可以减少匹配的次数。在减少匹配次数的情况下,还可以完成两个结果集的拼接。

a连接b连接c

a 10条记录

b 10条记录

c 10条记录

匹配次数是:1000

 

a连接b一个结果 :10*10-->100次

a连接c一个结果:10*10-->100次

使用union的话是:100次+100次=200次(union把乘法变成了加法运算)

 

union在使用的时候有注意事项吗?

union在进行结果集合并的时候,要求两个结果集的列数相同。

select ename,job from emp where job = 'MANAGER'union select ename from emp where job = 'SALESMAN' ;

 

mysql可以,oacle语法严格,不可以,报错。要求:结果集合并时列和列的数据类型也要一致

 select ename,job from emp where job = 'MANAGER'union select ename,sal from emp where job = 'SALESMAN' ;

 

limit(非常重要)

limit的作用:将查询结果集的一部分取出来。通常使用在分页查询当中。

百度默认:一页显示10条记录

分页的作用是为了提高用户的体验,因为一次全部都查出来,用户体验极差,可以一页一页翻页看。

 

limit怎么使用呢?

完整用法:limit startindex,length

startindex是起始下标,length是长度

起始下标从零开始。

缺省用法:limit 5;这是取前5

按照薪资排序,取出排名在前5名的员工。

 select ename,sal from emp order by sal desc limit 5;

 

取出工资排名在[3-5]名的员工

select ename,sal from emp order by sal desc limit 2,3;

在MySQL中limit是在order by执行后再执行。

 

取出工资排名在[5-9]名的员工?

select ename,sal from emp order by sal desc limit 4,5;

 

分页

每页显示3条数据

第一页:limit 0,3

第二页:limit 3,3

第三页:limit 6,3

第四页:limit 9,3 

每页显示pagesize条记录

第pageNo页:limit(pageNo-1)*pageSize,pageSize

记公式:

limit (pageNo-1)*pageSize ,pageSize;

 

关于DQL语句的大总结

select 。。。from。。。where。。。group by  having 。。。order by。。。limit。。。

执行顺序?

1、from

2、where

3、group by

4、having

5、select

6、order by

7、limit。。 

 

表的创建(建表)

建表的语法格式:(建表属于DDL语句,DDL包括create drop alter)

create table 表名(字段名1 数据类型,字段名2 数据类型,字段名3 数据类型);

表名:建议以t_或者 tbl_开始,可读性强。见名知意。

字段名:见名知意

表名和字段名都属于标识符

 

关于mysql中的数据类型

  很多数据类型,我们只需要掌一些常见的数据类型即可。

  varchar(最长255)   可变长度的字符串 比较智能,节省空间,会根据实际的数据长度动态分配空间。优点:节省空间   缺点:需要动态分配空间,速度慢

  char(最长255)  定长字符串 不管实际的数据长度是多少 分配固定长度的空间去存储数据 使用不恰当的时候,可能会导致空间的浪费 

varchar 和char 我们应该怎么选择?

性别字段你选什么?因为性别是固定长度的字符串,所以选择char。

姓名字段你选什么?每一个人的名字长度不同,所以选择varchar。

  int(最长11)  数字中的整数型。等同于java的int

  bigint   数字中的长整型,等同于java中的long  

  float  单精度浮点型数据

  double  双精度浮点型数据

  date  短日期类型

  datetime  长日期类型

  clob  字符大对象 最多可以存储4G的字符串 比如:存储一篇文章,存储一个说明 超过255个字符的都要采用字符大对象存储

      Character Large OBject :CLOB  

  blob  二进制大对象

      Binary Large OBject

      专门用来存储图片、声音、视频等流媒体数据。

      往BLOB类型的字段上插入数据的时候,例如插入一个图片、视频等,你需要使用IO流才行。

 

删除表:drop tale t_student;//当这张表不存在的时候会报错

 

drop table if exists t_student;

 

插入数据:

语法格式:

insert into 表名 (字段名1,字段名2,字段名3.。。)values(值1,值2,值3)

注意:字段名和值要一一对应。什么是一一对应?

数量要对应。数据类型要对应。

insert into t_student (no,name,sex,age,email) values (1,'zhangsan','m',20,'zhangsan@123.com');

注意:insert语句但凡是执行成功了,那么必然会多一条记录。没有给其他字段指定值的话,默认值是NULL

insert的字段名可以省略,不过表示要插入所有的字段。

 

insert 插入日期:

数字格式化:format  (数字,'格式');

 

str_to_date :将字符串varchar类型转成date类型,通常使用在插入insert方面,因为插入的时候需要一个日期类型的数据,需要通过该函数将字符串转成date

语法格式: str_to_date ('字符串日期','日期格式');

mysql的日期格式:

%Y 年

%m 月

%d 日

%h 时

% i 分

% s 秒

好消息? 如果你提供的日期的类型是这个格式,str_to_date 函数就不需要了!!!

%Y-%m-%d

date_format :将date类型转换成具有一定格式的varchar 字符串类型

date_format 函数怎么用?

date_format (日期类型数据,‘日期格式’)

这个函数通常使用在查询日期方面。设置展示的日期格式。

SQL语句会进行默认的日期格式化。

自动将数据库中的date类型转换成varchar类型。并且采用的格式是mysql默认的日期格式。'%Y-%m-%d'

 

java中的日期格式?

yyyy-MM-dd HH:mm:ss SSS

 

date 和datetime两个类型的区别?

date是短日期:只包括年月日信息。

datetime是长日期:包括年月日时分秒信息。

mysql 中短日期默认格式:%Y-%m-%d

MySQL长日期默认格式:%Y-%m-%d %h:%i:%s

在mysql中获取系统当前时间:now()函数,并且获取的时间带有:时分秒信息!!是datetime类型的。

 

修改update(DML)

update 表名 set 字段名1 = 值1,字段名2 = 值2 ,字段名3 = 值3 。。。where 条件;

注意:没有条件限制会导致所有数据全部更新。

 

删除数据 delete (DML)

delete from 表名 where 条件 ;

注意:没有条件,整张表的数据会全部删除。

 

insert语句可以一次插入多条数据。

语法:insert into t_user (字段名1 ,字段名2)values (),(),();

 

快速创建表(了解内容)

 create table emp2 as select * from emp;

原理:将一个查询结果当作一张表新建!!!
这个可以完成表的快速复制。

表可以创建出来,同时表中的数据也存在了。

 

将查询结果插入到一张表中。(insert)了解内容

create table dept_bak as select * from dept;

insert into dept_bak select * from dept;(很少用)

 

快速删除表中的数据?

delete from dept_bak ;

这种删除数据的方式比较慢。

delete语句删除数据原理?

表中的数据被删除了,但是这个数据在硬盘上的真实存储空间不会被释放!!!

这种删除的缺点是:删除效率比较低。

这种删除的优点是:支持回滚,后悔了可以再恢复数据!!!

start transaction ;

rollback;

 

truncate语句删除数据的原理?

这种删除效率比较高,表被一次截断,物理删除

这种删除缺点:不支持回滚。

这种删除优点:快速。

用法:truncate table dept_back ;(这种操作属于DDL)

大表非常大,上亿条记录???

删除的时候,使用delete,也许需要执行1个小时才能删除完!效率较低。

可以选择使用truncate删除表中的数据。只需要不到1秒钟的时间就删除结束。效率较高

但是在使用truncate之前,必须仔细询问客户是否真的要删除,并警告删除之后不可恢复!

 

删除表操作?  

drop table 表名 //这不是删除表中的数据,这是把表删除。 

 

对表结构的修改?

什么是对表结构的修改

  添加一个字段,删除一个字段,修改一个字段!!!

对表结构的修改需要使用alter

属于DDL语句

DDL包括:create drop alter

第一:在实际的开发过程中,需求一旦确定之后,表一旦设计好之后,很少的进行表结构的修改。因为开发进行中的时候,修改表结构,成本比较高。修改表的结构,对应的java代码就需要进行大量的修改。成本是比较高的。这个责任应该由设计人员来承担!
第二:由于修改表结构的操作较少,所以我们不需要掌握,如果有一天真的要修改表结构,你可以使用工具。

修改表结构的操作是不需要写道java程序中的。实际上也不是java程序员的范畴。

 

约束(非常重要,5颗星)

什么是约束?

约束对应的英文单词:constraint

在创建表的时候,我们可以给表中的字段加上一些约束,来保证这个表中数据的完整性、有效性!!!

约束的作用就是为了保证:表中数据有效!!

 

约束包括哪些?

非空约束 :not null

唯一性约束 :unique

主键约束:primary key(简称PK)

外键约束:foreign key (简称FK)

检查约束 :check (mysql不支持,Oracle支持)

我们重点学习四个约束:

not null

unique 

primary key 

foreign  key

 

非空约束 :not null

非空约束not null约束的字段不能为NULL

drop table if exists t_vip;

create table t_vip (id int ,name varchar(255) not null);

insert into t_vip(id ,name) values (1,'zhangsan');

insert into t_vip(id,name) values (2,'lisi');

insert into t_vip (id) values (3);

 

小插曲:

  xxx.sql这种文件被称为sql脚本文件

  sql脚本文件中编写了大量的sql语句

  我们执行sql脚本文件的时候,该文件中所有的sql语句会全部执行

  批量的执行sql语句,可以使用sql脚本文件。

  在mysql中怎么执行sql脚本呢?

  source +......sql文件的绝对路径。

 

唯一性约束 unique

唯一性约束unique约束的字段不能重复,但是可以为null

 

新需求:name和eamil两个字段联合起来唯一。

约束直接添加在列后面,被称为列级约束。

约束没有添加到列的后面,这种约束被称为表级约束。

什么时候使用表级约束?

需要给多个字段联合起来添加一个约束的时候,需要使用表级约束。

 

unique 和not null可以联合吗?

可以。

在mysql中,如果一个字段同时被not null 和unique约束的话,该字段自动变成主键字段。(注意:oracle中不一样)

 

主键约束(primary key,简称PK)非常重要5颗星

主键约束的相关术语?

  主键约束:就是一种约束。

  主键字段:该字段上添加了主键约束,这样的字段叫做:主键字段。

  主键值:主键字段中的每一个值都叫做:主键值。

什么是主键?有啥用?

  主键值是每一行记录的唯一标识

  主键值是每一行记录的身份证号!!!

记住:任何一张表都应该有主键,没有主键,表无效!!

主键的特征:not null + unique (主键不能是null,同时也不能重复!)

可以使用列级约束或者表级约束添加主键。

表级约束主要是给多个字段联合起来添加约束?

多个字段联合起来做主键叫做复合主键。

在实际开发中不建议使用复合主键,建议使用单一主键!

因为主键值存在的意义就是这行记录的身份证号,只要意义达到即可,单一主键可以做到,复合主键比较复杂,不建议使用!!!

 

一个表中主键约束能加两个么?

结论:一张表,主键约束只能添加一个。(主键只能有一个)

 

主键值建议使用:

int

bigint

char 等类型

不建议使用:varchar来做主键。主键值一般都是数字,一般都是定长的!

 

主键除了单一主键和复合主键之外,还可以怎样进行分类?

自然主键:主键值是一个自然数,和业务没有关系

业务主键:主键值和业务紧密关联,例如拿银行卡账号做主键值。这就是业务主键!

在实际开发中使用业务主键多,还是使用自然主键多一些?

  自然主键使用比较多,因为主键只要做到不重复就行,不需要有意义

  业务主键不好,因为主键一旦和业务挂钩,那么当业务发生变动的时候,可能会影响到主键值,所以业务主键不建议使用。尽量使用自然主键。

在mysql当中,有一种机制可以帮助我们自动维护一个主键值?

auto_increment  

 

外键约束(foreign key,简称FK)非常重要五颗星

外键约束 :一种约束(foreign key)

外键字段:该字段上添加了外键约束

外键值:外键字段当中的每一个值。

 

业务背景:

请设计数据库表,来描述”班级和学生“的信息

第一种方案:班级和学生存储在一张表中???

分析以上方案的缺点:

数据冗余,空间浪费!!!

这个设计是比较失败的!

第二种方案:班级一张表、学生一张表?

t_class 班级表 classno(pk) classname

t_student 学生表 no(pk) name cno(FK引用t_class这张表的classno)

 

当cno字段没有任何约束的时候,可能会导致数据无效。可能出现一个102,但是102班级不存在

所以为了保证cno字段中的值都是100和101,需要给cno字段添加外键约束。

那么:cno字段就是外键字段,cno字段中的每一个值都是外键值。 

注意:

t_class 是父表

t_studet 是子表

删除表的顺序?

先删子,再删父

创建表的顺序?

先创建父,再创建子

删除数据的顺序?

先删子,在删父

插入数据的顺序?

先插父,再插入子

 

思考:子表中的外键引用的父表中的某个字段,被引用的字段必须是主键吗?

不一定是主键,但至少具有unique约束。这样在引用的时候就不会引起歧义。

 

测试:外键可以为NULL吗?

外键值可以为NULL

 

存储引擎(了解内容)

什么是存储引擎,有什么用?

存储引擎是mysql中特有的一个术语,其他数据库中没有。(oracle中有,但不是叫这个名字。)

存储引擎这个名字 高端大气上档次。

实际上存储引擎是一个表存储/组织数据的方式。

不同的存储引擎,表存储数据的方式不同。

 

怎么给表添加或者指定存储引擎。

在建表的时候可以在最后小括号的”)“右边使用:

ENGINE 来指定存储引擎。

CHARSET来指定这张表的字符编码方式。

 

结论:

  mysql默认的存储引擎是:InnoDB

  mysql默认的字符编码方式是:utf8

怎么查看mysql支持哪些存储引擎。

命令:show engines \G;

mysql支持九大存储引擎,当前5.5.36支持8个。版本不同支持情况不同。

 

关于mysql常用的存储引擎介绍一下

MyISAM存储引擎

  它管理的表具有以下特征:

    使用三个文件表示每个表:

    格式文件 - 存储表结构的定义 (mytable.frm)

    数据文件 - 存储表行的内容 (mytable.MYD)

    索引文件 - 存储表上索引(mytable.MYI):索引是一本书的目录,缩小扫描范围,提高查询效率的一种机制。

  可被转换为压缩、只读表来节省空间

  提示一下:对于一张表来说,只要是主键,或者加有unique约束的字段会自动创建索引

MyISAM存储引擎特点:

  可被压缩、只读表来节省空间。这是这种引擎的优势!!!

MyISAM不支持事务机制,安全性低

 

InnoDB存储引擎?

这是mysql默认的存储引擎,同时也是一个重量级的存储引擎。

InnoDB支持事务,支持数据可以崩溃后自动恢复机制。

InnoDB存储引擎最主要的特点是:非常安全。

它管理的表具有下列主要特征:

  每个InnoDB表在数据库目录中以.frm格式文件表示

  InnoDB表空间tablespace被用于存储表的内容(表空间是一个逻辑名称。表空间存储数据+索引)

  提供一组用来记录事务性活动的日志文件

  用commit(提交)、SAVEPOINT及ROLLBACK(回滚)支持事务处理

  提供全ACID兼容

  在MySQL服务器崩溃后提供自动恢复

  多版本(MVCC)和行级锁定

  支持外键及引用的完整性,包括级联删除和更新

InooDB最大的特点就是支持事务:

  以保证数据的安全。效率不是很高,并且也不能压缩,不能转换为只读,不能很少的节省存储空间。

 

MEMORY存储引擎?

  使用MEMORY存储引擎的表,其数据存储在内存中,且行的长度固定,这两个特点使得MEMORY存储引擎非常快。

  MEMORY存储引擎管理的表具有下列特征:

  在数据库目录内,每个表均以.frm格式的文件表示。

  表数据及索引被存储在内存中。(目的就是快,查询快!)

  表级锁机制

  不能包含TEXT或HEAP引擎

 

MEMORY引擎优点:查询效率是最高的。

MEMORY引擎缺点:不安全,关机之后数据消失,因为数据和索引都是在内存当中的。

 

事务(重点:五颗星,必须理解,必须掌握)

什么是事务?

  一个事务其实就是一个完整的业务逻辑

什么是一个完整的业务逻辑?

  假设转账,从A账户向B账户中转账10000

  将A账户的钱减去10000(update语句)

  将B账户的钱减去10000(update语句)

这是一个完整的业务逻辑

以上的操作是一个最小的工作单元,要么同时成功,要么同时失败,不可再分。

这两个update语句要求必须同时成功或者同时失败,这样才能保证钱是正确的。

 

只有DML语句才会有事务这一说,其他都没有关系

insert 

delete

update

只有以上的三个语句和事务有关系,其它都没有关系。

因为 只有以上的三个语句是数据库中数据进行增、删、改的。

只要你的操作一旦涉及到数据的增、删、改,那么就一定要考虑安全问题。

数据安全第一位!!!

 

假设所有的业务,只要一条DML语句就能完成,还有必要存在事务机制吗?

正是因为做某件事的时候,需要多条DML语句共同联合起来才能完成,

所以需要事务的存在。如果任何一件复杂的事儿都能一条DML语句搞定,

那么事务则没有存在的价值了。

到底什么是事务呢?

说到底,说到本质上,一个事务其实就是多条DML语句同时成功,或者同时失败!

 

事务是怎么做到多条语句同时成功或者同时失败的呢?

InnoDB存储引擎:提供一组用来记录事务性活动的日志文件

事务开启了:

insert

insert

delete

delete

update

update

事务结束了!!!!

 

在事务的执行过程中,每一条DML的操作都会记录到“事务性活动的日志文件”中。

在事务的执行过程中,我们可以提交事务,也可以回滚事务。

 

提交事务?

  清空事务性活动的日志文件,将数据全部彻底持久化到数据库表中。

  提交事务标志着,事务的结束。并且是一种全部成功的结束。

回滚事务?

  将之前所有的DML操作全部撤销,并且清空事务性活动的日志文件

  回滚事务标志着,事务的结束。并且是一种全部失败的结束。

 

怎么提交事务,怎么回滚事务?

提交事务:commit ;语句

回滚事务:rollback ;语句(回滚永远都是只能回滚到上一次的提交点)

事务对应的英语单词是: transaction

测试一下,MySQL当中的默认事务行为是怎样的?

  mysql默认情况下是支持自动提交事务的。(自动提交)

什么是自动提交?

  每执行一条DML语句,则提交一次!

这种自动提交实际上是不符合我们的开发习惯,因为一个业务通常是需要多条DML语句共同执行才能够完成的,

为了保证数据的安全,必须要求同时成功之后再提交,所以不能执行一条就提交一条。

 

怎么将mysql的自动提交机制关闭?

  先执行这个命令:start transaction;

 

事务包括四个特性:

A:原子性

说明事务是最小的工作单元。不可再分

C:一致性

所有事务要求,在同一事务当中,所有操作必须同时成功,或者同时失败,以保证数据的一致性

I:隔离性

A事务和B事务之间有一定的隔离。

教室A和教室B之间有一道墙,这道墙就是隔离性。

A事务在操作一张表的时候,另一个事务B也操作这张表会怎样?

D:持久性

事务最终结束的一个保障。事务提交。就相当于将没有保存到硬盘上的数据保存到硬盘上!

 

重点研究事务的隔离性!!!

A教室和B教室中间有一道墙,这道墙可以很厚。也可以很薄。这就是事务的隔离级别。

这道墙越厚,表示隔离级别就越高。

事务和事务之间的隔离级别有哪些呢?4个级别

读未提交 : read uncommitted (最低的隔离级别)《还没提交就可以读取》

  什么是读未提交?

    事务A可以读取到事务B未提交的数据

  这种隔离级别存在的问题就是:

    脏读现象!(Dirty Read)

    我们称读到了脏数据

  这种隔离级别一般都是理论上的,大多数的数据库隔离级别都是二档起步!

读已提交: read committed 《提交之后也能读取数据》

  什么是读已提交?

    事务A只能读取到事务B提交之后的数据。

  这种隔离级别解决了什么问题?

    解决了脏读的现象

  这种隔离级别存在什么问题?

    不可重复读取数据。

    什么是不可重复读取数据呢?

       在事务开启之后,第一次读到的数据是3条,当前事务还没有结束,可能第二次再读取到的时候,

       读到的数据是4条,3不等于4称为不可重复读取。

  这种隔离级别是比较真实的数据,每一次读到的数据是绝对的真实。oracle数据库默认的隔离级别是:read committed

可重复读:repeatable read  《提交之后也读不到,永远读取的都是刚开启事务时的数据》

  什么是可重复读取?

    事务A开启之后,不管是多久,每一次在事务A中读取到的数据都是一致的。即使事务B将数据已经修改,并且提交了,事务A读取到的数据还是没有发生改变,这就是可重复读。

  可重复读解决了什么问题?

    解决了不可重复读取数据。

  可重复读存在的问题是什么?

    可能会出现幻影读。

    每一次读取到的数据都是幻象,不够真实!

 

早晨9点开启了事务,只要事务不结束,到晚上9点,读到的数据还是那样!

读到的是假象,不够绝对的真实。

mysql中默认的事务隔离级别就是这个!!!!!!

 

序列化/串行化读:serializable (最高的隔离级别)

  这是最高隔离级别,效率最低。解决了所有的问题。

  这种隔离级别表示事务排队,不能并发!

  synchronized,线程同步(事务同步)

  每一次读取到的数据都是最真实的,并且效率是最低的。

 

验证隔离级别

查看隔离级别:select @@tx_isolation

mysql默认的隔离级别:repeatable-read

验证:read uncommited

设置隔离级别: set global transaction isolation level read uncommitted;

重启控制台

事务A                                                 事务B

--------------------------------------------------------------------------

start transaction                            start transaction

select * from t_user;      insert into t_user values('zhangsan');

select * from t_user;    

因为:开启事务之后在没有提交的前提下,不会进行持久化。            

验证:read commited

set global transaction isolation level read committed;

事务A             事务B

-----------------------------------------------------------------------------------

start transaction          start transaction

select * from t_user;        insert into t_user values ('zhangsan');

select * from t_user;        commit;

select * from t_user;

 

验证:repeatable read

 

事务A             事务B

-----------------------------------------------------------------------------------

 start transaction;        start transaction;

select * from t_user;       delete from t_user;

select * from t_user; 

 

 

验证:serializable 

事务A             事务B

-----------------------------------------------------------------------------------

start transaction         start transaction

select * from t_user;

                insert into t_user values('zhangsan');

select * from t_user;-----------------------等待排队中,直到事务B结束才可访问

                commit / rollback;

 

索引

什么是索引?

  索引是在数据库表的字段上添加的,是为了提高查询效率存在的一种机制。一张表的一个字段可以添加一个索引,当然,多个字段联合起来也可以添加索引。索引相当于一本书的目录,是为了所缩小扫描范围而存在的一种机制。

 

对于一本字典来说,查找某个汉字有两种方式:

第一种方式:一页一页挨着找,直到找到为之,这种查找方式属于全字典扫描。效率比较低

第二种方式:先通过目录(索引)去定位一个大概的位置,然后直接定位到这个位置,做局域性扫描,缩小扫描的范围,快速的查找。这种查找方式属于通过索引检索,效率较高。

 

t_user

select * from t_user where name = 'jack';

以上的这条SQL语句会去name字段上扫描,为什么?

  因为查询条件是:name ='jack';

如果name字段上没有加索引(目录),或者说没有给name字段创建索引,MySQL会进行全扫描,会将name字段上的每一个值都比对一遍。效率比较低

MySQL在查询方面主要就是两种方式:

第一种方式:全表扫描。

第二种方式:根据索引检索。

 

注意:在实际中,汉语字典前面的目录是排序的,按照a b c d e f ...排序,为什么排序呢?因为只有排序了才会有区间查找这一说!(缩小扫描范围其实就是扫描某个区间罢了!)

在mysql数据库当中索引也是需要排序的,并且这个索引的排序和Treeset数据结构想同。TreeSet(Treemap)底层是一个自平衡的二叉树!在MySQL当中索引是一个B-Tree数据结构。

遵循左小右大原则存放。采用中序遍历方式遍历取数据

 

索引的实现原理?

假设有一张用户表 :t_user    (每一行记录在硬盘上都有物理存储编号)

 

提醒1:在任何数据库当中的主键上都会自动添加索引对象,id字段上自动会有索引,因为id是FK。另外在MySQL当中,一个字段上如果有unique约束的话,也会自动创建索引对象

提醒2:在任何数据库当中,任何一张表的任何一条记录在硬盘存储上都有一个硬盘的物理存储编号。

 提醒3:在MySQL当中,索引是一个单独的对象,不同的存储引擎以不同的形式存在,在MyISAM存储引擎中,索引存储在一个.MYI文件中。在InnoDB存储引擎中,索引存储在一个逻辑名称叫做tablespace的当中。在MEMORY存储引擎当中索引被存储在内存当中。不管索引存储在哪里,索引在MySQL当中都是一个树的形式存在。(自平衡二叉树:B-Tree)

 

 

 

索引实现原理:就是缩小扫描的范围,避免全表扫描

idIndex(id字段的索引对象)

 

 

 select * from t_user where id = 101;

MySQL发现id字段上有索引对象,所以会通过索引对象idIndex进行查找

通过idIndex索引对象定位到101(缩小扫描范围,快速定位)

通过101得出物理编号:0x6666,此时马上SQL转换;

select * from t_user where 物理编号 = 0x6666;

 

在MySQL当中,主键上,以及unique字段上都会自动添加索引的!!!
什么条件下,我们会考虑给字段添加索引?

条件1:数据量庞大(到底有多么庞大算庞大,这个需要测试,因为每一个硬件环境不同)

条件2:该字段经常出现在where的后面,以条件的形式存在,也就是说这个字段总是被扫描

条件3:该字段很少的DML(insert update delete)操作。因为在DML之后,索引需要重新进行排序

建议不要随意添加索引 ,因为索引也是需要维护的,大多的话反而会降低系统的性能。建议通过主键查询,建议通过unique约束的字段查询,效率会比较高。

 

索引怎么创建?怎么删除?语法是什么?

创建索引:

  create index emp_ename_index on emp(ename);

给emp表的ename字段添加索引,起名:emp_ename_index

 

删除索引:

  drop index emp_ename_index on emp;

 

怎么查看一个SQL语句是否使用了索引进行检索?

explain select * from emp where ename = 'KING';

 

索引有失效的时候,什么时候索引失效呢?

失效的第一种情况:

select * from emp where ename like '%T';

ename 上即使添加了索引,也不会通过索引,这是为什么?

  原因是因为模糊匹配当中以"%"开头了

  尽量避免模糊查询的时候以"%"开始

  这是一种优化的手段/策略。

 

失效的第二种情况:

使用or的时候会失效,如果使用or那么要求两边的条件字段都要有索引,才会走索引,如果其中一边有一个字段没有索引,那么另一个字段上的索引也会失效。所以这就是为什么不建议使用or的原因。

 可以使用union用于提高效率。

 

失效的第三种情况:

使用复合索引的时候,没有使用左侧的列查找,索引失败。

什么是复合索引?

  两个字段,或者更多的字段联合起来添加一个索引,叫做复合索引。

create index emp_sal_job_index on emp(job,sal);

 

失效的第四种情况:

在where当中索引列参加了运算,索引失效。

explain select * from emp where sal + 1 = 800;

 

失效的第五种情况:

在where当中索引列使用了函数。

explain select * from emp where lower(ename)='smith';

 

索引是各种数据库进行优化的重要手段。优化的时候优先考虑的因素就是索引。

索引在数据库当中分了很多类?

单一索引:一个字段上添加索引

复合索引:两个字段或者更多的字段上添加索引

主键索引:主键上添加索引

唯一性索引:具有unique约束的字段上添加索引

。。。。。

注意:唯一性较弱的字段上添加索引用处不大。

 

视图

什么是视图?

view:站在不同的角度去看待同一份数据。

 

怎么创建视图对象?怎么删除视图对象?

创建视图对象:

create view dept2_view as select * from dept2;

删除视图对象:

drop view dept2_view;

注意:只有DQL语句才能以view的形式创建。

  create view view_name as 这里的语句必须是DQL语句;

 

用视图做什么?

  我们可以面向视图对象进行增删改查,对视图对象的增删改查,会导致原表被操作!(视图的特点:通过对视图的操作,会影响到原表数据。)

多张表关联形成的视图,也能够修改数据。

 

视图在实际开发中到底有什么用?《方便,简化开发,利于维护》

假设有一条非常复杂的SQL语句,而这条SQL语句需要在不同的位置上反复使用。每一次使用这个SQL语句的时候都需要重新编写,很长,很麻烦,怎么办?

可以把这条复杂的SQL语句以视图对象的形式新建。

在需要编写这条SQL语句的位置直接使用视图对象,可以大大简化开发。

并且利于后期的维护,因为修改的时候也只需要修改一个位置就行,只需要修改视图对象所映射的SQL语句。

我们以后面向视图开发的时候,使用视图的时候可以像使用table一样。可以对视图进行增删改查等操作。视图不是在内存当中,视图对象也是存储在硬盘上的,不会消失。

 

再提醒一下:

  视图对应的语句只能是DQL语句。

  但是视图对象创建完成之后,可以对视图进行增删改查等操作。

小插曲:

  增删改查,又叫做:CRUD

  CRUD是在公司中程序员之间沟通的术语。一般我们很少说增删改查。一般都说CRUD

  C:Create(增)

  R:Retrive(查:检索)

  U:Update(改)

  D:Delete(删)

 

DBA常用命令?

重点掌握:

  数据的导入和导出(数据的备份)

  其他命令了解一下即可。

 数据导出?

  注意:在mysql的dos命令窗口中:

    mysqldump cqdatabase>D:\cqdatabase.sql -uroot -p123

数据导入?

source D:\cqdatabase.sql;

注意:需要先登录到mysql数据库服务器上

然后创建数据库:create database .....;

使用数据库 use database

然后初始化数据库 source 。。。。。;

 

数据库设计三范式

什么是数据库设计范式?

  数据库表的设计依据。教你怎么进行数据库表的设计。

数据库设计范式共有?

3个

第一范式:要求任何一张表必须有主键,每一个字段原子性不可再分

第二范式:建立在第一范式的基础之上,要求所有非主键字段完全依赖主键,不要产生部分依赖

第三范式:建立在第二范式的基础之上,要求所有非主键字段直接依赖主键,不要产生传递依赖

 

声明:三范式是面试官经常问的,所以一定要熟记在心!

设计数据库表的时候,按照以上的范式进行,可以避免表中数据的冗余,空间的浪费。

 

第一范式

最核心,最重要的范式,所有表的设计都需要满足。

必须有主键,并且每一个字段都是原子性不可再分。

 

 以上是学生表,满足第一范式吗?

不满足,第一:没有主键。第二:联系方式可以分为邮箱地址和电话

 

 

以上满足第一范式。

 

第二范式:

  建立在第一范式的基础之上

  要求所有非主键字段必须完全依赖主键,不要产生部分依赖。

 

 学生编号 教师编号,两个字段联合做主键,复合主键(pk:学生编号+教师编号)

经过修改之后,以上的表满足了第一范式。但是满足第二范式吗?

  不满足,“张三”依赖1001,“王老师”依赖001,显然产生了部分依赖。

产生部分依赖有什么缺点?

  数据冗余了。空间浪费了。“张三”重复了,“王老师”重复了。

 

为了让以上的表满足第二范式,你需要这样设计:
  使用三张表来表示多对多的关系!!!

 背口诀:

  多对多怎么设计?

  多对多,三张表,关系表两个外键!!!!!

 

第三范式

  第三范式建立在第二范式的基础之上

  要求所有非主键字段必须直接依赖主键,不要产生传递依赖。

 

以上表的设计是描述:班级和学生的关系,很显然是1对多关系!

一个教室中有多个学生。 

分析以上表是否满足第一范式?
  满足第一范式,有主键

分析以上表是否满足第二范式?

  满足第二范式,因为主键不是复合主键,没有产生部分依赖。主键是单一主键。

分析以上表是否满足第三范式?

  第三范式要求:不要产生传递依赖!

  一年一班依赖01,01依赖1001,产生了传递依赖。

  不符合第三范式的要求。产生了数据的冗余。

 

那么应该怎么设计一对多呢?

 

 背口诀:

  一对多,两张表,多的表加外键!!!!

 

 

总结表的设计?

一对多:

  一对多,两张表,多的表加外键!!!!!!!!!

多对多:

  多对多,三张表,关系表两个外键!!!!!!!!

一对一:

  一对一放到一张表中不就行了吗?为啥还要拆分表?

  在实际的开发中,可能存在一张表字段太多,太庞大。这时候要拆分表。

口诀:一对一,外键唯一!!!!!!!!!!!!!!!!(FK + unique)

 

嘱咐一句话:

数据库设计三范式是理论上的。

实践和理论有的时候有偏差。

最终的目的都是为了满足客户的需求,有的时候会拿冗余换执行速度

因为在sql当中,表和表之间的连接次数越多,效率越低(笛卡尔积)

有的时候可能会存在冗余,但是为了减少表的连接次数,这样做也是合理的,并且对于开发人员来说,sql语句的编写难度也会降低。

面试的时候把这句话说上:他就不会认为你是初级程序员了!

 

 

 

 

 

 

 

 

 

 

 

 

  

 

posted @ 2021-10-12 11:15  夏天·烟火·我的尸体  阅读(212)  评论(0)    收藏  举报