BASE理论之思考

一、什么是BASE理论？

BASE理论是对CAP中一致性和可用性权衡的结果，它的核心思想是：即使无法做到强一致性，但每个应用都可以根据自身业务特点，采用适当的方式来使系统达到最终一致性。

BASE理论包含如下三个元素:

BA:基本可用；
S:软状态，状态可以在一段时间内不同步；
E:最终一致性，在一定的时间窗口内，最终数据达成一致即可。

1.什么是基本可用？

举例说明:
以曾经做过的OJ系统为例，OJ系统一般宕机的原因，主要是很多学员在相同的某个时间段统一提交。那么什么时候大多学员会统一提交呢？
一般刷题的时候，时间不确定，有的人喜欢上午刷题，有的人喜欢晚上刷题。基本上OJ是能够承载着不确定时间的提交。问题提到大多学员会在什么时候统一提交，答案是考试，考试有一定的时间规定，例如120分钟或150分钟等，超过时间规定范围视为放弃考试，一般考试会提交10分钟内交卷，而这个10分钟承载着大量的学员提交，而这个大量提交不亚于电商秒杀商品。大量的学员提交，会造成系统一度假死状态，即不能正常对外提供服务，通常我们的做法是弹性伸缩，所谓弹性伸缩就是每到考试的时候，服务器会自动根据学员提交的情况来决定是否创建更多的实例，通过创建更多的实例来平衡服务压力。但有些时候并不是创建更多的实例就能应对的，例如12306抢票，全国人民抢票回家，针对这样的场景，不仅仅是加机器来横向扩容保证服务可用，还得服务将降级处理，所谓服务降级分为两个层面，一个是延迟服务，另一个是暂停目前用不到的服务把资源给优先级高的服务，以此来达到服务基本可用的目的。

2.什么是软状态？

举例说明:
以批量导入大量的历史数据为例，成千上万的Excel文件，里面装有上亿的数据，针对这些数据，系统使用人员在导入数据的过程中，总希望导入一个能够马上得到实时反馈(成功了多少，失败了多少，失败的原因是什么)，但从实际中来看，几百万条数据插入到数据库，肯定会消耗数据库资源，一定程度上降低数据库性能，使得其它应用服务受到一定程度上的影响。以我上家公司的解决办法就是延迟插入，首先用户在导入数据的时候，我们会马上提示，数据正在导入中，导入成功后会给该用户发送手机短信或者是邮件，但其实数据正在导入中并没有马上导入，而是进入到一个数据导入任务队列中，排队执行，先进先出，当执行到该任务时，数据任务导入队列会集中多个服务器进行数据导入，分批次导入，这样一来效率高的多。当然了，这样一来，用户不能马上看到数据，但这在一定程度上提高了系统整体可用性，避免因为数据导入而影响对外的正常服务，正好符合软状态，即数据状态可以在一段时间内不同步。

3.什么是最终一致性？

举例说明:
以很久以前我写的一个博客爬虫为例，博客爬虫分别是有三个，一个思否爬虫，一个是CSDN爬虫，最后是博客园爬虫，三个系统均是一个小的SpringBoot微服务，我的主服务仍然是博客系统，爬虫数据抓取并实时入库，会在一定程度上导致我的主博客系统访问缓慢，原因是因为爬虫应用抓取数据并实时入库，性能在数据库上，后来我想了一个办法将爬虫数据库放在阿里云的RDS上，每当晚上的23点到第二天的5点，这个时间段，爬虫会将爬虫数据库上面的数据迁移到我的主博客系统上。
以此来保证数据的最终一致性，也就是我不一定要数据马上入库能看到效果，我可以允许一定的延迟时间，只要最终某个时间段我能看到大量的数据即可，当时做这个的目的在于那个时候研究数据库SQL优化，在研究SQL优化层面，我需要造一批数据，但我不喜欢假数据，于是通过爬虫抓取一些真实的数据，这些真实的数据主要为我个人服务，一方面作为学习的素材，另外一方面可以基于真实的内容做一些数据分析。

二、为什么会产生BASE理论？

新的理论的产生总是为了改进和完善旧有的理论，但本质上仍然变化不大(这也是左耳朵耗子为什么着重说要注重基本功，也包括我的导师以及老J也曾说过多次)。
例如:
从单体应用到分布式微服务应用、从CAP理论到BASE理论、从前后端不分离到前后分离等，就很好的说明了这一点。

posted @ 2021-06-06 13:06 挑战者V 阅读(354) 评论(0) 收藏举报

刷新页面返回顶部

挑战者V

新博客地址:https://youcongtech.com，希望我的博客能够给大家带来帮助。