大促准备(六)预案配置和演练

一.为什么要有预案

事有轻重缓急,对于一个系统也是如此,在大促期间通常会将系统中一些不太重要的业务或操作给降级,比如详情日志打印、营销类的消息、业务控制等,将资源用于大促中不得不操作的业务上;或者在大促过程中进行链路的切换,比如启用近端、启用异步执行或者合并执行等。
一个系统通常有多个这样的操作,如果一个一个执行,操作的工作量、确认工作量、总执行耗时都会比较大,并且容易造成遗漏,因为为了方便起见,会把一个系统所有的操作汇总成一个大促预案,在需要执行时可以一次性的批量执行。

二.预案分类

简单的说,预案可以这样分类:
5ab57b49-a87a-444b-bab0-569c889eaf67.png

三.预案配置和预案验证单

预案的具体内容各个系统都不尽相同,需要根据实际情况进行配置,通用情况来看需要注意的地方有如下:

  1. 确定每一个降级内容的影响面,如果影响到下游或关联系统,一定要进行同步
  2. 确定好验证降级是否执行的方法,是通过监控查看还是通过日志查看。如果是日志,日志的内容是否清晰明白
  3. 确定预案执行时间
  4. 确定预案回滚时间
  5. 确定预案回滚后的验证方法

四.预案演练

预案演练是为了验证所配置的预案是否达到了真正了期望值,在执行预案演练前要准备好预案验证单,在预案执行时对照这个list执行即可,避免出现遗漏。

由于系统服务器数量较多,在进行预案验证时,最好能够对每一个机房都进行下抽查,避免预案在某一个机房没有执行。同时预案回滚时,也最好能够对每一个机房都进行下抽查,避免某些预案没有回滚,导致影响到系统功能的不完善。

posted on 2017-11-14 20:11  孙振超  阅读(672)  评论(0编辑  收藏  举报