架构设计(一)

架构

系统: 一群有关联的个体 , 规则, 能力(产生了新能力)

子系统

模块:逻辑角度 -> 组件复用

组件: 物理角度 -> 单元分离

框架: 组件规范:mvc,等

架构:结构

 

1. 软件架构:指软件系统的顶层结构。

首先,系统是一群关联的个体组成,这些个体可以是子系统, 模块, 组件等;

其次, 系统中的个体需要根据某种规则运作, 架构需要明确个体运作和协作的规则;

第三,顶层结构的说法可以更好的区分系统和子系统。

2. 历史背景

三难

机器语言 -> 汇编语言 -> 高级语言

3.目的

解决软件系统复杂度的问题。

找复杂点

性能, 高可用, 扩展性, 存储高可靠, 安全性,成本。

4. 复杂度来源:高性能

单机:操作系统

多机:任务分配, 任务分解

5. 复杂度来源:高可用   ->  冗余

无中断

计算高可用:

  1. 任务分配器
  2. 连接(与业务处理器)
  3. 算法(分配)

存储高可用:

传输线路(故障)

 

状态决策:

  • 独裁式
  • 协商式
  • 民主式: ->  脑裂 -> 解决:选举超一半

6. 复杂度来源:可扩展性

  1. 正确预测变化
  2. 完美封装变化

变化层, 接口稳定层

抽象层, 实现层

7. 复杂度来源:低成本, 安全, 规模

低成本 -> 附加约束

  • 引入新事物
  • 创造新事物

安全

  • 功能安全:SQL注入, 代码漏洞
  • 架构安全: 防火墙

规模: ->  量变引起质变 而带来的复杂度:

  • 功能越来越多,系统复杂度指数增长
  • 数据越来越多,系统复杂度发生质变

8. 架构设计原则

选择(不确定性)

  1. 合适原则: 合适由于业界领先
  2. 简单原则:简单优于复杂(结构复杂, 逻辑复杂,算法复杂)
  3. 演化原则:演化由于一步到位

9. 案例

 

10. 架构设计流程:识别复杂度

列出复杂度问题,排序依次解决;

理解需求,找复杂度 -> 可用排查法,从不同角度逐一分析

每秒TPS , 平均值, 峰值(2-4倍平均值)

设计目标用峰值计算。

复杂度

  • 高性能
  • 高可用
  • 扩展性

TPS:写入

QPS:查询

eg.  目前TPS 是115, QPS是1150,

则峰值 x 3, TPS是345, QPS是3450  ->  这个量级不要求高性能;

预留后续发展, 按 峰值 x 4, TPS是 1380, QPS是13800 -> 高性能

不同的公司会有不同的复杂度分析: 安全,或成本

eg. 消息队列

前浪微博:复杂度体现在

  • 高性能消息读取
  • 高性能消息写入
  • 高可用消息存储
  • 高可用消息读取

11. 架构流程设计:设计备选方案

常见错误:

  1.设计最优秀的方案

  2. 只做一个方案

应设计3-5个备选方案。

备选方案差异要比较明显

备选方案的技术不要只限于已熟悉的技术

备选方案不用过于详细 ->  应关注技术选型,而不是细节

eg. 设计备选方案 - > 高性能读取,写入,高可用存储,读取。

  1. 用kafka

  2. 集群 + mysql 存储

高性能读取,写入 ->  Java, 基于netty开发消息队列

高可用存储,读取 ->  服务器的主备方案, mysql的主备复制。

  3. 集群 + 自研存储方案

可参考kafka,自己实现一套存储和复制方案。

12. 架构设计流程:评估和选择备选方案

  • 最简派
  • 最牛派
  • 最熟派
  • 领导派

分场景使用

  1. 360度环评表: 列出我们需要关注的质量属性点,分别从这些点的维度评估每个方案,再综合选合适当时情况的最优方案。

常见的方案质量属性点:性能,可用性, 硬件成本, 项目投入,复杂度,安全性,可扩展性,可维护性等。

  2. 按优先级选择

13. 架构设计流程: 详细方案设计

确定方案 的关键细节

详细设计方案阶段,可能遇到一种极端情况,发现备选方案不可行。

一般情况下,主要原因是涉及备选方案时遗漏了关键技术点或关键质量属性。

这种情况下,可通过以下方式避免:

  1. 架构师不但要备选方案的设计和选型,还要对备选方案的关键细节有深入理解
  2. 通过分步骤,分阶段,分系统,降低复杂度
  3. 如果方案本身复杂,可采取设计团队,博采众长,汇集大家的智慧。

14. 高性能数据库:读写分离

本质:将访问压力分散到集群中的多个节点,但没分散存储压力。

基本原理:将数据库读写操作分散到不同的节点上。

主 + 从  集群: 主负责读/写,从负责读。

不同于 主 + 备

基本实现:

  • 数据库服务器,搭建主从集群,一主一从或一主多从 都可以。
  • 主机负责读写,从机负责读
  • 数据库主机通过复制将数据同步到从机,每个数据库都存了所有数据
  • 业务服务器将写发给主数据库,读发给从数据库。

有两个复杂点:1. 主从复制延迟; 2. 分配机制

1. 复制延迟

先假设延迟1秒,数据写入主库后立刻访问从库,读取不到最新数,例如注册,会有业务问题。

它的常规解决方法:

  1. 写操作后的读操作指定发主数据库 ->  和业务强绑定,对业务侵入和影响较大
  2. 读从机失败后,再读一次主机  ->  即二次读取,无业务绑定,只需对底层数据库的访问封装,代价小,但若有很多二次读取,将增加主机的读取压力
  3. 关键业务读写都指向主机,非关键业务读写分离

2. 分配机制

将读写区分,访问不同的数据库,一般有两种方式:程序代码封装和中间件封装

  2.1 程序代码封装:在代码中抽象一个数据访问层,实现读写分离和数据库连接管理。

特点:实现简单,可根据业务做定制化功能;

每个语言实现一次;

故障情况下,如果主从发生切换,则需要所有系统都修改配置并重启;

eg. 淘宝的 TDDL(Taobao Distributed Data Layer)

基本原理:基于集中式的配置Jdbc datasource实现: 有主备,读写分离

基本架构

 

   2.2 中间件封装

指独立出一套系统,实现读写分离和数据库服务器连接的管理。

一般建议,程序语言封装或用成熟中间件

Mysql Router, 

Atlas : 基于Mysql Proxy

 

思考:

读写分离一般用于实现什么场景?支撑多的业务规模?

读多写少,实时性要求不高

15. 高性能数据库集群:分库分表

分散存储

数据量 从千万到亿 , 就会有单台瓶颈。

业务分库

按业务分到不同的数据库 ->  分库能支撑百万甚至千万规模业务。

存在问题:join 问题(不同库), 事务, 成本等。

分表

垂直拆分, 水平拆分

垂直:

 

水平:

复杂性

  1. 路由 - 范围路由(分布不均匀), hash路由(分布均匀), 配置路由(用单独的表记录路由信息)

  2. join

  3. count (count相加,记录数表)

  4. order by 

实现方式:代码封装,中间件封装

16. 高性能NoSQL 

not only SQL, 弥补数据库缺陷

关系数据库缺点:

  1. 存储的行记录,无法存数据结构 - 无法直接存列表
  2. schema 扩展不方便: 操作不存在的列会报错,扩充列要DDL,麻烦
  3. 大数据场景下, I/O较高; 单列统计 ,会读取整行
  4. 全文搜索功能较弱; like 整表扫描, 性能低

NoSQL分4类

  • k-v存储:解决无法存数据结构的问题, 以Redis为代表
  • 文档数据库:解决强schema约束问题,以MongoDB为代表
  • 列式数据库:解决大数据场景下I/O问题,以HBase为代表
  • 全文搜索索引:解决全文搜索性能问题,以Elasticsearch为代表

Redis

 eg, lpop 移除list第一个元素。

缺点:不支持完整的ACID, 只保证隔离性和一致性,无法保证原子性和持久性。

文档数据库

特点:no-schema,可存储和读取任意数据,大部分是Json格式存储

优点:

  • 新增字段简单
  • 历史数据不会出错
  • 更易存储复杂数据

适合场景:电商和游戏

缺点:不支持事务,无法join操作。

列式数据库

对比,关系数据库,行式存储:读多列,效率高,能一次完成对一行对个列写操作。

列式数据库:对某个列统计,节省I/O;有更高的压缩比(行:3:1 - 5:1; 列: 8:1, 30:1)

一般将列式存储用在大数据分析和统计场景;主要针对部分单列操作,且写入后无需再更新,删除;

全文搜索引擎

基本原理:倒排索引,是一个索引方法,是建立单词到文档的索引。

使用方式:将关系数据转换为文档数据Json。

Elasticsearch是分布式文档存储方式,每个字段的所有数据默认被索引。

17.高性能缓存架构

某些复杂场景,单靠存储系统,性能提升是不够的。

  a. 要经过复杂运算后得到的数据

  b. 读多写少的数据

缓存-基本原理:将可能重复使用的数据放到内存,一次生成,多次使用,避免每次使用都访问存储系统。

mechache 单台支持50000 TPS以上。

缓存-架构设计要点:

  1. 缓存穿透:指缓存中没数据,都查了存储系统。

有两种情况:

  a. 存储数据不存在  -  解决:可设置一个默认值

  b. 缓存数据生成耗费大量的时间或资源

  2. 缓存雪崩:指缓存失效后,引起系统性能急剧下降的情况

解决:

  a. 更新锁机制:对缓存更新操作加锁保护,集群时需要设置分布式锁。

  b. 后台更新:由后台线程更新缓存,而不是业务线程;缓存本身设置有效期永久,后台定时更新;

    当内存不足时,会踢掉数据,可有两种办法:

      1>. 后台除定时更新缓存,还要频繁读缓存

      2>. 业务线程发现缓存失效,通过消息队列发一条消息通知后台线程更新缓存。

还可以用后台更新进行缓存预热。

  3. 缓存热点

   对于一些特别热点的数据,大部分业务请求都命中同一份缓存数据,则这份数据所在的缓存服务器压力也很大。

缓存热点的解决方案是:复制多份缓存副本,将请求分散到多个缓存服务器,减轻缓存热点导致后台服务器压力。

一个细节要注意:不同的缓存副本不要设置统一的过期时间,应设置一个过期时间范围,不同副本过期时间是指定范围的随机值。

实现方式:

  • 程序代码的中间层方式实现
  • 独立中间件实现

18. 单服务器高性能模式:PPC与TPC

磁盘,操作系统,cpu,内存,网络,编程语言,架构, 都可能影响达到高性能。

架构师要考虑:高性能架构的设计

集中两个点

  • 尽量提升单服务性能,将单服务器性能发挥到极致
  • 如果单台服务器无法支持性能,设置服务器集群方案

还和编码有关

架构设计决定系统性能的上限,实现细节决定下限。

单服务器性能关键之一:服务器采用并发模型。

关键设计点:

  • 服务器如何管理连接
  • 服务器如何处理请求

这两个设计点都和操作系统的I/O模型及进程模型相关。

I/O模型: 阻塞, 非阻塞, 同步,异步

进程模型: 单进程, 多进程, 多线程

单服务器高性能模式:PPC, TPC

PPC

: process per connection ,指每次有新的连接就新建一个进程,去专门处理这个连接的请求。

 

 适合连接没那么多的情况。

缺点:

  1. fork代价高
  2. 父子进程通信复杂
  3. 支持的并发连接数量有限

一般情况下,PPC最多能处理的并发连接数就几百。

prefork  ->  提前创建进程

TPC

Thread per connection. 每次有新的连接就新建一个线程,专门处理这个连接的请求。

TPC基本流程:

TCP虽然解决了fork代价高和进程通信复杂的问题,但有其他问题:

  1. 高并发性能问题
  2. 没有进程仅通信,但线程间的互斥和共享,易导致死锁
  3. 多线程相互影响,一个线程异常,整个进程退出

因此,几百连接的场景,更多用PPC

prethread -> 提前创建线程

19.单服务器高性能模式:Reactor与Proactor

PPC和TPC无法支持高并发

Reactor

资源复用,进程池

read阻塞  ->  改为了非阻塞,进程轮询多个连接(当连接太多,轮询效率低)

再改进 -> 只有连接上有数据,进程才去处理 -> 这就是I/O多路复用技术的来源。

I/O多路复用,关键实现点:

  1. 当多个连接共用一个阻塞对象后,进程只需要在一个阻塞对象上等待,无需轮询连接
  2. 当某个连接有新数据处理时,操作系统会通知进程,进程从阻塞状态返回,开始处理

I/O多路复用 + 线程池 ; 支持高并发,叫做 Reactor, 反应堆, 事件反应

Reactor 模式也叫 Dispatcher模式, 即I/O多路复用统一监听事件,收到事件后,分配(Dispatcher)给某个进程。

核心组成:Reactor 和 处理资源池

  • Reactor 负责监听和分配事件
  • 处理资源池 负责处理事件

Reactor 数量可变, 资源池数量可变。

Reactor 三种典型实现:

  • 单Reactor 单进程/线程
  • 单Reactor 多线程
  • 多Reactor 多线程/进程

 

 

Proactor

同步是指进程在执行read, send这类I/O操作时,是同步的,如果把I/O改为异步,进一步提升性能,这就是异步网络模型 Proactor. 

Proactor 异步网络模型 , 主动器

 

 Proactor Initiator 创建handler , Proactor 并将它们通过Asynchronous Operation Processor 进行注册,

Asynchronous Operation Processor 负责处理注册请求,并完成I/O操作,完成后通知Proactor。

Proactor 根据不同的事件类型回调不同的Handler进行业务处理。

Handler完成业务处理,也可以注册新Handler到内核进程。

20. 高性能负载均衡:分类及架构

高性能集群的本质:增加更多的服务器提升系统整体的计算能力。

复杂度:任务分配

体现在要增加一个任务分配器(又叫负载均衡器),以及为任务选一个合适的任务分配算法。

实际任务分配不只考虑任务的负载均衡,不同任务的分配算法不同,有的基于负载考虑,

有的基于性能(吞吐量, 响应时间), 有的基于业务。

负载均衡不只是为了计算单元的负载达到均衡状态。

常见的负载均衡系统有3种:

  • DNS负载均衡
  • 硬件负载均衡
  • 软件负载均衡

 

posted @ 2022-05-06 11:52  Vincent-yuan  阅读(342)  评论(0编辑  收藏  举报