一、服务容错核心知识
在微服务架构中,一个请求需要调用多个服务是非常常见的。如客户端访问A服务,而A服务需要调用B服务,B服务需要调用C服务,由于网络原因或者自身的原因,如果B服务或者C服务不能及时响应,A服务将处于阻塞状态,直到B服务C服务响应。此时若有大量的请求涌入,容器的线程资源会被消耗完毕,导致服务瘫痪。服务与服务之间的依赖性,故障会传播,造成连锁反应,会对整个微服务系统造成灾难性的严重后果,这就是服务故障的“雪崩”效应。
雪崩是系统中的蝴蝶效应导致其发生的原因多种多样,有不合理的容量设计,或者是高并发下某一个方法响应变慢,亦或是某台机器的资源耗尽。从源头上我们无法完全杜绝雪崩源头的发生,但是雪崩的根本原因来源于服务之间的强依赖,所以我们可以提前评估,做好熔断,隔离,限流。
二、解决方案
1、服务隔离
顾名思义,它是指将系统按照一定的原则划分为若干个服务模块,各个模块之间相对独立,无强依赖。当有故障发生时,能将问题和影响隔离在某个模块内部,而不扩散风险,不波及其它模块,不影响整体的系统服务。
2、熔断降级
熔断这一概念来源于电子工程中的断路器(Circuit Breaker)。在互联网系统中,当下游服务因访问压力过大而响应变慢或失败,上游服务为了保护系统整体的可用性,可以暂时切断对下游服务的调用。这种牺牲局部,保全整体的措施就叫做熔断。
所谓降级,就是当某个服务熔断之后,服务器将不再被调用,此时客户端可以自己准备一个本地的fallback回调,返回一个缺省值。 也可以理解为兜底
3、服务限流
限流可以认为服务降级的一种,限流就是限制系统的输入和输出流量已达到保护系统的目的。一般来说系统的吞吐量是可以被测算的,为了保证系统的稳固运行,一旦达到的需要限制的阈值,就需要限制流量并采取少量措施以完成限制流量的目的。比方:推迟解决,拒绝解决,或者者部分拒绝解决等等。
三、hystrix介绍
Hystrix是由Netflix开源的一个延迟和容错库,用于隔离访问远程系统、服务或者第三方库,防止级联失败,从而提升系统的可用性与容错性。Hystrix主要通过以下几点实现延迟和容错。
- 包裹请求:使用HystrixCommand包裹对依赖的调用逻辑,每个命令在独立线程中执行。这使用了设计模式中的“命令模式”。
- 跳闸机制:当某服务的错误率超过一定的阈值时,Hystrix可以自动或手动跳闸,停止请求该服务一段时间。
- 资源隔离:Hystrix为每个依赖都维护了一个小型的线程池(或者信号量)。如果该线程池已满,发往该依赖的请求就被立即拒绝,而不是排队等待,从而加速失败判定。
- 监控:Hystrix可以近乎实时地监控运行指标和配置的变化,例如成功、失败、超时、以及被拒绝的请求等。
- 回退机制:当请求失败、超时、被拒绝,或当断路器打开时,执行回退逻辑。回退逻辑由开发人员自行提供,例如返回一个缺省值。
- 自我修复:断路器打开一段时间后,会自动进入“半开”状态。
四、rest实现服务熔断
1、配置依赖
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
2、开启熔断,启动类添加@EnableCircuitBreaker
3、配置熔断降级业务
/** * 使用注解配置熔断保护 * fallbackmethod : 配置熔断之后的降级方法 */ @HystrixCommand(fallbackMethod = "orderFallBack") @RequestMapping(value = "/buy/{id}",method = RequestMethod.GET) public Product findById(@PathVariable Long id) { if(id != 1) { throw new RuntimeException("服务器异常"); } return restTemplate.getForObject("http://service-product/product/1",Product.class); }
/** * 降级方法 * 和需要收到保护的方法的返回值一致 * 方法参数一致 */ public Product orderFallBack(Long id) { Product product = new Product(); product.setProductName("触发降级方法"); return product; }
有代码可知,为findById方法编写一个回退方法orderFallBack,该方法与findById方法具有相同的参数与返回值类型,该方法返回一个默认的错误信息。在findById方法上,使用注解@HystrixCommand的fallbackMethod属性,指定熔断触发的降级方法是orderFallBack。
- 因为熔断的降级逻辑方法必须跟正常逻辑方法保证:相同的参数列表和返回值声明。
- 在findById方法上HystrixCommand(fallbackMethod = "findProductFallBack") 用来声明一个降级逻辑的方法
服务挂掉或超时会自动进入熔断fallback方法
五、默认fallback
我们刚才把fallback写在了某个业务方法上,如果这样的方法很多,那岂不是要写很多。所以我们可以把Fallback配置加在类上,实现默认fallback:
@RestController @RequestMapping("/order") /** * @DefaultProperties : 指定此接口中公共的熔断设置 * 如果过在@DefaultProperties指定了公共的降级方法 * 在@HystrixCommand不需要单独指定了 */ //@DefaultProperties(defaultFallback = "defaultFallBack") public class OrderController { ...... @HystrixCommand @RequestMapping(value = "/buy/{id}",method = RequestMethod.GET) public Product findById(@PathVariable Long id) { if(id != 1) { throw new RuntimeException("服务器异常"); } return restTemplate.getForObject("http://service-product/product/1",Product.class); } /** * 指定统一的降级方法 * * 参数 : 没有参数 */ public Product defaultFallBack() { Product product = new Product(); product.setProductName("触发统一的降级方法"); return product; } }
六、超时设置
在之前的案例中,请求在超过1秒后都会返回错误信息,这是因为Hystix的默认超时时长为1,我们可以通过配置修改这个值:
hystrix: command: default: execution: isolation: thread: timeoutInMilliseconds: 3000 #默认的连接超时时间1秒,若1秒没有返回数据,自动的触发降级逻辑
七、Feign实现熔断
1、配置依赖(SpringCloud Fegin默认已为Feign整合了hystrix,所以添加Feign依赖后就不用在添加hystrix)
2、修改application.yml在Fegin中开启hystrix
在Feign中已经内置了hystrix,但是默认是关闭的需要在工程的application.yml 中开启对hystrix的支持
feign: hystrix: #在feign中开启hystrix熔断 enabled: true
3、配置FeignClient接口的实现类
基于Feign实现熔断降级,那么降级方法需要配置到FeignClient接口的实现类中
@Component public class ProductFeignClientCallBack implements ProductFeignClient { /** * 熔断降级的方法 */ public Product findById(Long id) { Product product = new Product(); product.setProductName("feign调用触发熔断降级方法"); return product; } }
4、修改FeignClient添加hystrix熔断
在@FeignClient注解中添加降级方法,@FeignClient注解中以fallback声明降级方法
@FeignClient(name="service-product",fallback = ProductFeignClientCallBack.class) public interface ProductFeignClient { /** * 配置需要调用的微服务接口 */ @RequestMapping(value="/product/{id}",method = RequestMethod.GET) public Product findById(@PathVariable("id") Long id); }