随笔分类 - 稳定性
摘要:DDoS威胁的现状 互联网和我们的工作、生活,已经结合得越来越紧密。互联网上承载了越来越多的重要业务,已经成为了关乎国计民生的关键基础设施。DDoS攻击,是对互联网基础设施的重要威胁之一,甚至可能导致一些关键业务发生长时间中断。在网上已经有很多相关的案例,在此不再阐述。 DDoS防护的现状 DDoS
阅读全文
摘要:这一篇文章描述DDoS流量清洗实现的一些思路。 假设有这样一种场景:一个武林高手和一个基本没有功底的人切磋武艺,胜负如何是无需多言;换另一种场景,如果是十个普通人和武功高手对招,虽然可能费点力气,但是武功高手还是可以再拿下一城;更进一步假设,一百个毫无底子的成年人一拥而上,和这名高手对打,如果高手的
阅读全文
摘要:DNS容灾 这里介绍如果通过dns来实现容灾,饿了么有非常多的应用,应用的用户量非常大,遍布各地。这些应用都是需要域名的,所以为了提神服务质量,构建自己的DNS体系,为饿了么的应用提供域名解析服务。 DNS简单介绍 DNS提供了根据域名查IP地址的服务,和常见的http协议一样,dns也是一个工作在
阅读全文
摘要:这里结合自己负责的过保迁移项目、之前的生产经验,和处理过的一些case记录一下自己的一些思考。 首先3个前提 原则1: 牢记安全生产红线。安全生产红线的意义在于 提变更的时候更慎重的审视自己的变更方案,也可以让更多的人交叉review; 信息广播,有助于变更执行人评估是否有交叉影响的变更; 一旦出问
阅读全文
摘要:变更3要素 1. 可灰度 2. 可监控 3. 可应急 变更红线 1. 禁止在非变更窗口期、封网期进行变更(不同的公司变更期不通,基本都有高峰期/低峰期的规定);这些变更包括但不限于:压测,代码提交到生成,紧急线上变更需要走审批流程。 2. 禁止未经测试验证, 预发验证,或者灰度的线上变更 3. 禁止
阅读全文
摘要:引子 近期随着业务的改造,新旧交替,不同系统的稳定性问题大量爆发,基于此我们对稳定加大了投入,梳理出来了部分保证系统平稳运行的方法论,在这里做一下分享,切记"稳定性压倒一切". 保障总则 保障总则,即保障策略,对于一个系统,如果要做到全方位的稳定性保障,应该具备一下3个硬性条件,脱离这3个条件,很难
阅读全文
摘要:安全生产的重要性 安全生产是我们的底线,随着业务的不断扩大,服务的范围变广,线上的故障和问题开始频发;这些故障给客户和公司带来了不可估量的损失,不仅影响我们在业界的口碑,更会影响客户群对我们的信任. 我们需要思考,别人为什么使用你的服务?如果你的服务故障了,用户有怎样的反响?出现故障了我们如何止损,
阅读全文
摘要:一 单点故障 单点故障概念 单点故障是指系统中一旦失效,就会让整个系统无法运作的部件。 从架构上来说是一种典型的系统性风险,因为如果系统存在单点,即使系统的其它部分做得再完备,也无法降低单点故障造成的破坏性,因此单点故障出现必然导致整体故障。无论是应用服务器还是底层网络、存储,应该尽量避免出现单点故
阅读全文

浙公网安备 33010602011771号