MySQL数据库之互联网常用架构方案

一、数据库架构原则

高可用
高性能
可扩展
一致性

二、常见的架构方案

方案一：主备架构，只有主库提供读写服务，备库冗余作故障转移用

jdbc:mysql://vip:3306/xxdb

高可用分析：高可用，主库挂了，keepalive（只是一种工具）会自动切换到备库。这个过程对业务层是透明的，无需修改代码或配置。
高性能分析：读写都操作主库，很容易产生瓶颈。大部分互联网应用读多写少，读会先成为瓶颈，进而影响写性能。另外，备库只是单纯的备份，资源利用率50%，这点方案二可解决。
一致性分析：读写都操作主库，不存在数据一致性问题。
扩展性分析：无法通过加从库来扩展读性能。
可落地分析：两点影响落地使用。第一，性能一般，这点可以通过建立高效的索引和引入缓存来增加读性能，进而提高性能。这也是通用的方案。第二，扩展性差，这点可以通过分库分表来扩展。

方案二：双主架构，两个主库同时提供服务，负载均衡

jdbc:mysql://vip:3306/xxdb

高可用分析：高可用，一个主库挂了，不影响另一台主库提供服务。这个过程对业务层是透明的，无需修改代码或配置。
高性能分析：读写性能相比于方案一都得到提升，提升一倍。
一致性分析：存在数据一致性问题。请看，一致性解决方案。
扩展性分析：当然可以扩展成三主循环，但不建议（会多一层数据同步，这样同步的时间会更长）。如果非得在数据库架构层面扩展的话，扩展为方案四。
可落地分析：两点影响落地使用。第一，数据一致性问题，一致性解决方案可解决问题。第二，主键冲突问题，ID统一地由分布式ID生成服务来生成可解决问题。

方案三：主从架构，一主多从，读写分离

jdbc:mysql://master-ip:3306/xxdb

jdbc:mysql://slave1-ip:3306/xxdb

jdbc:mysql://slave2-ip:3306/xxdb

高可用分析：主库单点，从库高可用。一旦主库挂了，写服务也就无法提供。
高性能分析：大部分互联网应用读多写少，读会先成为瓶颈，进而影响整体性能。读的性能提高了，整体性能也提高了。另外，主库可以不用索引，线上从库和线下从库也可以建立不同的索引（线上从库如果有多个还是要建立相同的索引，不然得不偿失；线下从库是平时开发人员排查线上问题时查的库，可以建更多的索引）。
一致性分析：存在数据一致性问题。请看，一致性解决方案。
扩展性分析：可以通过加从库来扩展读性能，进而提高整体性能。（带来的问题是，从库越多需要从主库拉取binlog日志的端就越多，进而影响主库的性能，并且数据同步完成的时间也会更长。建议不要分多层，且一台主库一般挂3-5台从库吧。一般配置的mysql，并发最好控制在2000/s，挂5台的话，整体基本能支撑1w+/s的并发，再加上缓存和二八定律，基本能支撑小10w/s的并发，很高了。如果还不能满足需求，那还是选择去分库吧。）
可落地分析：两点影响落地使用。第一，数据一致性问题，一致性解决方案可解决问题。第二，主库单点问题，暂时没想到很好的解决方案（这点评论里给了一种方案，可参考）。

注：思考一个问题，一台从库挂了会怎样？读写分离之读的负载均衡策略怎么容错？

方案四：双主+主从架构，看似完美的方案

jdbc:mysql://vip:3306/xxdb

jdbc:mysql://slave1-ip:3306/xxdb

jdbc:mysql://slave2-ip:3306/xxdb

高可用分析：高可用。
高性能分析：高性能。
一致性分析：存在数据一致性问题。请看，一致性解决方案。
扩展性分析：可以通过加从库来扩展读性能，进而提高整体性能。（带来的问题同方案二）
可落地分析：同方案二，但数据同步又多了一层，数据延迟更严重。

三、一致性解决方案

第一类：主库和从库一致性解决方案

注：图中圈出的是数据同步的地方，数据同步（MySQL主从复制，简单来说就是从库从主库拉取binlog日志，再执行一遍，想深入了解可以去查阅“MySQL主从复制原理”相关资料）是需要时间的，这个同步时间内主库和从库的数据会存在不一致的情况。如果同步过程中有读请求，那么读到的就是从库中的老数据。如下图。

既然知道了数据不一致性产生的原因，有下面几个解决方案供参考：

直接忽略，如果业务允许延时存在，那么就不去管它。
强制读主，采用主备架构方案，或者代码指定读主库（一般不建议，这样就失去了读写分离的意义），读写都走主库。
选择读主，写操作时根据库+表+业务特征生成一个key放到Cache里并设置超时时间（大于等于主从数据同步时间）。读请求时，同样的方式生成key先去查Cache，再判断是否命中。若命中，则读主库，否则读从库。代价是多了一次缓存读写，基本可以忽略。
数据库中间件，引入开源（mycat等）或自研的数据库中间层。个人理解，思路同选择读主。数据库中间件的成本比较高，并且还多引入了一层。

第二类：DB和缓存一致性解决方案

先来看一下常用的缓存使用方式：

第一步：淘汰缓存；

第二步：写入数据库；

第三步：读取缓存？返回：读取数据库；

第四步：读取数据库后写入缓存。

一般来说，并发量不是特别大的话，上面的方式就可以。但是如果是高并发量的情况下，当写入时，你淘汰了缓存，但是还没写入数据库时或者主从延时，就有一个读请求完成了，此时缓存中就会缓存旧的数据。此时可以，写库完成时，等一会（根据业务场景评估）再删除一次缓存，这样缓存旧数据的概率又低了，不过这样一来数据库的压力就会有相应的增加，并且响应时间会增加。其实，要想保证数据库和缓存严格的一致性很难，甚至要付出很高的代价。网上还个方案，就是用本地内存队列来控制读请求和写请求串行化，利弊都有，感兴趣可深入研究：高并发场景下，如何保证缓存和数据库双写的一致性。另外，思考一下是不是能用基于临时顺序节点的Zookeeper分布式锁（用两个锁，一个读锁，一个写锁，当排在写锁后面的第一个读锁被通知时，读操作完成后，批量删除后面连续的读锁，注意不要引发羊群效应 -> 主备架构时）？

注：设置缓存时，一定要加上失效时间！

四、个人的一些见解

1、架构演变

架构演变一：方案一 -> 方案一+分库分表；
架构演变二：方案一 -> 方案三 -> 方案三+分库分表
架构演变三：方案一 -> 方案二 -> 方案二+分库分表

注：方案四一般不用。

2、个人见解

加缓存和索引是通用的提升数据库性能的方式；
分库分表带来的好处是巨大的，但同样也会带来一些问题，详见MySQL数据库之互联网常用分库分表方案。
不管是主备+分库分表还是主从+读写分离+分库分表，都要考虑具体的业务场景。一般大部分的数据库架构还是采用方案一和方案一+分库分表，典型的读多写少的场景用方案三+读写分离+分库分表。另外，阿里云提供的数据库云服务也都是主备方案，要想主从+读写分离需要二次架构。
记住一句话：不考虑业务场景的架构都是耍流氓。

posted @ 2018-08-07 23:30 尜尜人物阅读(12765) 评论(11) 收藏举报

刷新页面返回顶部

尜尜人物

MySQL数据库之互联网常用架构方案

一、数据库架构原则

二、常见的架构方案

方案一：主备架构，只有主库提供读写服务，备库冗余作故障转移用

方案二：双主架构，两个主库同时提供服务，负载均衡

方案三：主从架构，一主多从，读写分离

方案四：双主+主从架构，看似完美的方案

三、一致性解决方案

第一类：主库和从库一致性解决方案

第二类：DB和缓存一致性解决方案

四、个人的一些见解

1、架构演变

2、个人见解

公告