数据库的简单知识梗概

一、数据库优化

方法：

　　MySQL可以建分表，读写分离，建索引，一般经常更新的字段不适合建索引，建索引会降低数据非查询操作的效率。主键是一种特殊的索引。

　　导致索引失效的情况：1.如果条件中有or，即使其中有条件带索引也不会使用到。2.对于多列索引，不是使用的第一部分，则不会使用索引。3.like查询是以%开头，而不是以%结尾。4.如果索引列类型是字符串，一定要在条件中将数据使用引号引用起来，否则不使用索引。5.如果MySQL估计使用全表扫描要比使用索引快，则不使用索引。

二、MySQL引擎的种类和区别

①种类：MyISAM、InnoDB、MEMORY、MERGE、Archive、Blackhole、CSV、Federate、Merge、NDB集群引擎、第三方引擎：OLTP类引擎、面向列的存储引擎、社区存储引擎。

②区别：

A、MyISAM是MySQL5.1及之前的默认存储引擎。MyISAM不支持事务、也不支持外键，但其访问速度快，对事务完整性没有要求。MyISAM表还支持3中不同的存储格式：静态表、动态表、压缩表。

B、InnoDB存储引擎提供了具有提交、回滚、和崩溃恢复能力的事务安全。但是比起MyISAM存储引擎，InnoDB写的处理效率差一些并且会占用更多的磁盘空间以保留数据和索引。InnoDB的存储方式为：使用共享表空间存储；使用多表空间。

C、MEMORY存储引擎使用存在内存中的内容来创建表。每个MEMORY表只实际对应一个磁盘文件。MEMORY类型的表访问非常得快，因为它的数据是放在内存中的，并且默认使用HASH索引。但是一旦服务关闭，表中的数据就会丢失掉。

D、MERGE存储引擎是一组MyISAM表的组合，这些MyISAM表必须结构完全相同。MERGE表本身没有数据，对MERGE类型的表进行查询、更新、删除的操作，就是对内部的MyISAM表进行的。

三、数据库事务

四个特性：原子性、一致性、隔离性、持久性。

四个隔离级别：√：可能出现 ×：不会出现

	脏读	不可重复读	幻读
Read uncommitted	√	√	√
Read committed	×	√	√
Repeatable read	×	×	√
Serializable	×	×	×

Read Uncommitted（读取未提交内容）：
在该隔离级别，所有事务都可以看到其他未提交事务的执行结果。本隔离级别很少用于实际应用，因为它的性能也不比其他级别好多少。读取未提交的数据，也被称之为脏读（Dirty Read）。

Read Committed（读取提交内容）：
这是大多数数据库系统的默认隔离级别（但不是MySQL默认的）。它满足了隔离的简单定义：一个事务只能看见已经提交事务所做的改变。这种隔离级别也支持所谓的不可重复读（Nonrepeatable Read），因为同一事务的其他实例在该实例处理其间可能会有新的commit，所以同一select可能返回不同结果。

Repeatable Read（可重读）：
这是MySQL的默认事务隔离级别，它确保同一事务的多个实例在并发读取数据时，会看到同样的数据行。不过理论上，这会导致另一个棘手的问题：幻读（Phantom Read）。简单的说，幻读指当用户读取某一范围的数据行时，另一个事务又在该范围内插入了新行，当用户再读取该范围的数据行时，会发现有新的“幻影” 行。InnoDB和Falcon存储引擎通过多版本并发控制（MVCC，Multiversion Concurrency Control）机制解决了该问题。

Serializable（可串行化）：
这是最高的隔离级别，它通过强制事务排序，使之不可能相互冲突，从而解决幻读问题。简言之，它是在每个读的数据行上加上共享锁。在这个级别，可能导致大量的超时现象和锁竞争。

这四种隔离级别采取不同的锁类型来实现，若读取的是同一个数据的话，就容易发生问题。例如：
i. 脏读(Drity Read)：某个事务已更新一份数据，另一个事务在此时读取了同一份数据，由于某些原因，前一个RollBack了操作，则后一个事务所读取的数据就会是不正确的。
ii. 不可重复读(Non-repeatable read):在一个事务的两次查询之中数据不一致，这可能是两次查询过程中间插入了一个事务更新的原有的数据。
iii. 幻读(Phantom Read):在一个事务的两次查询中数据笔数不一致，例如有一个事务查询了几列(Row)数据，而另一个事务却在此时插入了新的几列数据，先前的事务在接下来的查询中，就会发现有几列数据是它先前所没有的。

一致性处理：

　　　　A、开启事务。B、申请写权限，也就是给对象(表或记录)加锁。C、假如失败，则结束事务，过一会重试。D、假如成功，也就是给对象加锁成功，防止其他用户再用同样的方式打开。E、进行编辑操作。F、写入所进行的编辑结果。G、假如写入成功，则提交事务,完成操作。 H、假如写入失败，则回滚事务，取消提交。I、(G、H)两步操作已释放了锁定的对象，恢复到操作前的状态。

　　　　基于事务的数据库引擎的选型：如果考虑到事务，推荐选用MySQL INNODB引擎；如果考虑速度，建议考虑MySQL MyISAM引擎，并且需要在代码层面做比较复杂的处理，如通过多线程、异步、非阻塞等方式对数据库进行清理，同时需要信号量、栏栅、数据库标志位等工具保证数据一致性。

四、海量数据处理

1.数据库扩展：

　　纵向扩展：基于业务的高度隔离性和数据的安全性，对业务和数据进行合理的切分，进行主-备机分离，主-主同步，主-从同步（对于MySQL数据库是单向异步同步机制），主-从热备等操作。

　　横向扩展：对数据表进行横向切分，按一定的规则（hash取模分、user_id尾数、自定义算法等）对数据表进行横向切分。

2.分布式数据方案：

　　提供分库规则和路由规则（RouteRule简称RR），将上面的说明中提到的三中切分规则直接内嵌入本系统，具体的嵌入方式在接下来的内容中进行详细的说明和论述；

　　引入集群（Group）的概念，保证数据的高可用性；

　　引入负载均衡策略（LoadBalancePolicy简称LB）；

　　引入集群节点可用性探测机制，对单点机器的可用性进行定时的侦测，以保证LB策略的正确实施，以确保系统的高度稳定性；

　　引入读/写分离，提高数据的查询速度。

posted @ 2019-08-19 17:51 桃子dev 阅读(331) 评论(0) 收藏举报

刷新页面返回顶部

桃子dev

尚未佩妥剑，转眼便江湖。愿历尽千帆，归来仍少年。

数据库的简单知识梗概

公告