数据库(MySQL) 入门实践

1 数据库

存放数据的仓库。例如你的账号信息,订单记录等。

2 SQL

Structured Query Language,用于访问和处理关系数据库的标准的计算机语言。

按照功能又可分为四大类;

  1. DQL

    查询语言,基本语句 SELECT;

  2. DML

    操纵语言,主要有三种形式,INSERT、UPDATE 和 DELETE;

  3. DDL

    定义语言,创建表、视图、索引等,CREATE TABLE;

  4. DCL

    控制语言,用来授权或回收某种特权,基本形式有 GRANT、 COMMIT 和 ROLLBACK;

3 NoSQL

Not Only SQL,泛指非关系型的数据库,通常以键值对或者文档形式存储。例如 Redis、MongoDB。

关系型数据库(MySQL)能通过外键建立表之间的联系,且相比 NoSQL 而言,还具备 ACID 特性。

但 NoSQL 操作无须 SQL 解析,读写性能较高,相比关系型数据库来说,不用预设存储结构,且天然支持分布式存储。

4 范式

数据库满足一定要求的条件称为数据库范式。又能根据程度的不同,简称为第 N 范式。

  1. 第一范式 1NF

    所有属性不可再分,例如属性 product 就不能分为 title 和 price,可以单独设置两个属性 productTitle、productPrice;

  2. 第二范式 2NF

    每张表都有一个属性作为唯一标识,其他属性完全依赖该标识,例如自增主键ID;

  3. 第三范式 3NF

    所有的非主属性不依赖于其他的非主属性。例如订单表中可以关联商品ID,但不应该关联商品非主属性 title 和 price 等;

为了提高查询效率,通常会添加冗余字段,这也就违背了 3NF,也称之为反三范式。

5 MySQL

MySQL 是一个 Oracle 旗下的关系型数据库,使用 SQL 语言进行增删改查操作。

开源免费,性能也比较好,和 PHP、Java 等 Web 开发语言完美配合,在中小型企业应用非常广泛。

后续内容都是基于 MySQL 数据库的前提下。

6 存储引擎

常见的有 MyISAM 和 InnoDB 引擎;

引擎 默认版本 外键 锁粒度 count(*) 事务
MyISAM < 5.5 不支持 表锁 变量存储 不支持
InnoDB >= 5.5 支持 行锁 全表扫描 支持

7 事务

一条或多条 SQL 组成一个事务(transaction),具备 ACID 四个特性;

  1. Atomicity 原子性

    一个事务内的所有操作,要么全部完成,要么全部失败;

  2. Consistency 一致性

    事务开始前后结束后不会破坏数据库的完整性,也就是说写入或修改的结构需要符合预设的规则;

  3. Isolation 隔离性

    防止事务交叉执行时导致数据的不一致。根据隔离程度分为 read uncommitted、read committed、repeatable read 和 serializable;

  4. Durability 持久性

    事务结束后,对数据的修改是永久的;

事务交叉执行可能会造成“脏读”、“幻读” 和 “不可重复读”;

  • 脏读

    一个事务读取到另外一个事务还未提交的数据;

  • 不可重复读

    一个事务内,多次读取同一数据返回结果不同;由于在此期间在数据被其他事务修改并已提交;

  • 幻读

    一个事务内,多次读取,返回不存在的记录;由于在此期间有其他事务写入数据;

read uncommitted read committed repeatable read serializable
脏读 × × ×
不可重复读 × ×
幻读 ×

8 索引

数据库的“目录”,在数据量较大的情况下,可以极大地提高查询效率。

常见的索引数据结构有 B+ 树、Hash。以最常用的 B+ 树为例;

按照 B+ 树存储方式可以把索引分为两大类;

  1. 聚簇索引;

    叶子节点存放了一整行的信息;

  2. 非聚簇索引;

    叶子节点存放的是对应那行数据的主键,和该索引的值;

为什么是 B+ 树?

  1. 磁盘代价低;
  2. 查询更加稳定;
  3. 便于遍历;
  4. 支持范围查询;

一张结构为 id,groupId,name 的 t_user 表,id 为主键(聚簇索引),groupId 为普通索引(非聚簇索引)。

select name from t_user where groupId = 123;

先在叶子节点上得到对应的主键 id,然后再根据主键 id 得到 name 的值,这种行为称之为回表

select groupId from t_user where groupId = 123;

直接在叶子节点上就能得到 groupId 的值,不用回表操作,这种索引也被称为覆盖索引

按照功能类型又可以把索引分为三大类;

  1. 普通索引;

    最基本的索引类型,没有限制条件;

  2. 唯一索引;

    保证索引字段的值唯一,允许有 NULL;主键是一种特殊的唯一索引,不允许有 NULL;

  3. 联合索引;

    多个字段组成一个索引,具有“最左前缀”的原则;

什么是最左前缀?

a、b、c 三个字段组成联合索引,那么生效的列为 a、ab、abc、ac。(等值判断时顺序可交换,范围查询时会停止匹配)

9 锁

宏观来看,锁分为两种;行锁可归纳为两类;

  1. 共享锁(S)

    share,又称为读锁,已有 S 锁,可以加其他 S 锁,但不能加 X 锁;

  2. 排他锁(X)

    exclusive,又称为写锁,X 与其他任何锁互斥;

InnoDB 是通过给索引项加锁实现的行锁,可分为三种类型;

  1. record lock

    行级锁,锁定对应索引项;

  2. gap lock

    间隙锁,锁定索引项之间的间隙,左开右闭;

  3. next-key lock

    前两种的结合;

如果不通过索引项检索数据,会锁住整个表。

InnoDB 加锁方法:

  • 对于 UPDATE、DELETE、INSERT 自动加 X 锁;
  • 对于普通 SELECT 不会加任何锁;
  • SELECT ... LOCK IN SHARE MODE 显示加 S 锁;
  • SELECT ... FOR UPDATE 显示加 X 锁;

查询当前数据库锁状态;

select * from information_schema.innodb_locks;

对于不同类型的索引,加锁的方式也不一样;

  1. 普通索引

    加 next-key lock;

  2. 唯一索引

    加 record lock;

由于普通索引叶子节点存储了主键,所以加锁的字段是:普通索引 + 主键索引;

假设有如下数据表 t_ lock,其中 id 为主键,xid 为 普通索引;

+-----+----+
| xid | id |
+-----+----+
|   1 | 10 |
|   3 | 20 |
|   5 | 30 |
|   8 | 40 |
|  11 | 50 |
+-----+----+

给 (8, 40) 这条记录加 X 锁;

select * from t_lock where xid = 8 for update;

那么根据 next-key lock 的定义,锁住区间为 (5, 30) 到 (8, 40),(8, 40) 到 (11, 50) 这两个区间;

便于理解我会合并为一个区间 (5, 30) 到 (11, 50)。

按照所以排序规则,假设另插入 (xid, id) 记录,那么总是满足以下条件;

  1. xid < 5;id 无限制;(正常)
  2. xid = 5;id < 30;(正常)
  3. xid = 5;id > 30;(阻塞)
  4. xid > 5 && xid < 11;id 无限制;(阻塞)
  5. xid = 11;id < 50;(阻塞)
  6. xid = 11;id > 50;(正常)
  7. xid > 11;id 无限制;(正常)

简单图示,当插入的数据落在这个区间则会阻塞,反之亦然;

10 RR 幻读

上面事务章节描述 RR 会导致幻读,MySQL 在 RR 下通过如下两点规避掉了;

  1. MVCC

    Multi-Version Concurrency Control,多版本并发控制。在普通 SELECT (快照度)时引入版本,同一个事务中只能读取不大于当前版本的数据快照;

  2. next-key lock

    需要加 X 锁的操作(当前读),加 next-key lock 可以有效避免产生幻读;

11 SQL 执行顺序

根据创建时间升序,查找支付成功超过 3 单的用户,需要去重;

select distinct t1.nickname
from t1 inner join t2
on t1.uid = t2.uid
where t2.pay_time > 0
group by t1.uid, t1.nickname
having count(*) > 3
order by t2.create_time
limit 10
  1. from
  2. on
  3. join
  4. where
  5. group
  6. having
  7. order
  8. select
  9. distinct
  10. limit

12 binlog

binlog 是 MySQL 最重要的日志,记录了所有的 DDL 和 DML 语句,主要目的是;

  1. 主从复制;

    在 Master 开启 binlog,并传递到 Slave 节点来达到 Master-Slave 数据一致性;

  2. 数据恢复;

    通过 mysqlbinlog 恢复数据;

检查 binlog 是否开启;

show variables like 'log_bin';

编辑 mysql 配置文件/etc/mysql/mysql.conf.d/mysqld.cnf,开启 binlog 功能;

[mysqld]
server-id=1
log-bin=/var/lib/mysql/mysql-bin

常用几个命令;

  • show master status;
  • show binary logs;
  • mysqlbinlog -v --start-position 2755 --stop-position 3076 mysql-bin.000003;

例如误删除了某条记录;

  1. 通过 mysqlbinlog 定位到误操作的 position;
  2. 通过 mysqlbinlog 定位到误删之前最早入库的 position;
  3. 截取中间 binlog 日志, echo > db.sql 输出到可执行 SQL 文件中;
  4. 执行恢复数据即可;

可直接流式执行:mysqlbinlog -v --start-position 2432 --stop-position 2533 mysql-bin.000003 | mysql -uroot -p

mysqldump 是用来备份数据库的,例如备份 db_test 数据库;

mysqldump -h127.0.0.1 -uroot -p123456 db_test > db.sql

13 性能优化

  1. 索引;

    给经常用作查询条件,且区分度较高的字段建立索引;

  2. 分页查询;

    where id > ${lastId} order by id limit ${size},提高大表分页效率;

  3. 批量操作;

    批量插入用 insert into xxx values (xxx...), (xxx...),批量更新用 case when id;

  4. not null;

    null 会额外占用空间,且 count(xxx) 不会参与统计,若是索引列 is not null 也会失效;

posted @ 2021-01-11 23:46  曹建涛  阅读(170)  评论(0编辑  收藏  举报