2021年1月26日
摘要: 问题 在最近一次压测时发现了一个现象:监控显示服务端p995耗时只有15ms左右,调用方的耗时却高达2000ms,二者相差巨大。 定位过程 查看cpu 查看了压测期间的cpu数据,发现cpu使用率只有20~30%,说明并不是cpu阻塞引起的调用方耗时高 查看jvm 查看了压测期间的jvm数据,发现压 阅读全文
posted @ 2021-01-26 22:23 孙振超 阅读(436) 评论(0) 推荐(0) 编辑
  2018年2月14日
摘要: 一、MessagePack是什么 先看官方的定义:MessagePack是一种高效的二进制序列化格式。它允许您像JSON一样在多个语言之间交换数据。但是,它更快并且更小。 从官方定义中,可以有如下的结论: MessagePack是一个二进制序列化格式,因而它序列化的结果可以在多个语言间进行数据的交换 阅读全文
posted @ 2018-02-14 21:31 孙振超 阅读(9616) 评论(3) 推荐(1) 编辑
  2018年1月20日
摘要: 容量规划是个资源管理的命题,其目标是解答运行中的系统需要多少容量以及在什么时候需要这些容量的问题,更简单的说法就是回答我们需要在什么时候加多少机器的问题。 容量规划整体上是一个从上到下,再从下到上的一个过程,先是明确公司整体的目标,而后各个业务域和系统进行拆解,估算出系统的需求,而后再逐步汇总,统计 阅读全文
posted @ 2018-01-20 21:25 孙振超 阅读(2582) 评论(1) 推荐(2) 编辑
  2017年11月14日
摘要: 上面的步骤虽然是有先后顺序的,但是在真正执行时并不是单向的,而是会有跳跃或者反复的 检讨总结非常重要,确保不要犯重复的问题 信任但需要确认,一定要确认,一定要确认,一定要确认, 不放过任何一个预料之外的现象,要找到问题的根源并予以解决,而不能有侥幸心理 阅读全文
posted @ 2017-11-14 20:15 孙振超 阅读(269) 评论(0) 推荐(1) 编辑
摘要: 老话讲:失败是成功之母,然而如果下一次的尝试时还是用上次失败时的老方法大概率还是要失败。因而更确切的说法是检讨是成功之母,失败了但进行了检讨找到了问题的根源,然后进行修正,用修正后的方法再次进行尝试获得成功的可能性将会大大增加。 复盘的作用就是如此,一方面总结在大促准备过程中碰到的问题,避免下次再犯 阅读全文
posted @ 2017-11-14 20:14 孙振超 阅读(472) 评论(0) 推荐(0) 编辑
摘要: 经过了前面的各种准备,大促终于到了,在大促当天要关注的事情也是相当多的,需要有条不紊的按部就班的执行。 1.值班安排 大促期间执行、验证、观察的事项还是比较多的,最好是有两个人进行主备,每一件事情最好能够double check,并且做好事项的分工。 2.应用服务器磁盘空间清理|重启 系统在运行过程 阅读全文
posted @ 2017-11-14 20:13 孙振超 阅读(537) 评论(0) 推荐(0) 编辑
摘要: 压测分为全链路压测和单系统服务接口压测两种,对于全链路压测要准备的事情和要改造的东西是特别多的,是一个相对庞大的系统工程,大致业务架构如下,可以单独列出一个系列来讲,这里只讲单系统的服务接口压测。 压测可以选择的框架有多种,可以根据系统所采用的代码、熟悉程度等选择一个,更好的方式是在开源的压测框架之 阅读全文
posted @ 2017-11-14 20:12 孙振超 阅读(764) 评论(1) 推荐(0) 编辑
摘要: 一.为什么要有预案 事有轻重缓急,对于一个系统也是如此,在大促期间通常会将系统中一些不太重要的业务或操作给降级,比如详情日志打印、营销类的消息、业务控制等,将资源用于大促中不得不操作的业务上;或者在大促过程中进行链路的切换,比如启用近端、启用异步执行或者合并执行等。一个系统通常有多个这样的操作,如果 阅读全文
posted @ 2017-11-14 20:11 孙振超 阅读(673) 评论(0) 推荐(0) 编辑
摘要: 压测是准备大促过程中至关重要的一个环节,在真正开始压测之前系统通常要做一定的改造,以使得压测请求的代码执行路径更符合实际情况,主要进行的改造和准备主要有如下内容 1、存储准备 对于压测服务中涉及到db(msyql、hbase、ob)的系统,在压测前需要联系DBA、PE先准备好所需的压测表。对于缓存( 阅读全文
posted @ 2017-11-14 20:10 孙振超 阅读(453) 评论(0) 推荐(0) 编辑
摘要: 限流主要是针对非核心服务调用者进行的。 1、确定限流对象 原则上,大促核心链路上的服务都要配置限流,以免大促期间的流量超过预估值把服务器压垮。同时还要考虑出口限流,主要是对db的限流,配置一个读写总流,以避免把服务器压垮。 2、确定限流实现方式 限流实现方式主要有两种: 方法1的好处是简单,缺点是限 阅读全文
posted @ 2017-11-14 20:09 孙振超 阅读(525) 评论(0) 推荐(0) 编辑