How to design a distributed file system?
什么分布式系统?用多台机器解决一台机器上不能解决的问题。
现在常用的分布式文件系统有两种:

按照4S 分析:
Scenario:
what functions do I have to implement?
基础场景:用户写入一个文件 用户读取一个文件
多少台机器储存这些文件?
service:
服务包含客户端和服务器端的服务


storage:存在哪里?怎么样存?
内存?数据库?文件系统?
都是分块存。
普通的小文件 我们用block存
普通的大文件我们用chunk存
超大的文件:chunk server + Master
所以对于超大文件 我们要熟知master+client+ChunkServer沟通流程。以及清楚master是用来文虎metadata和chunkserver的
scale:
系统如何优化与维护?即文件越来越多。
或者有一些corner case如何解决?
scale从两方面:读和写
具体请参见我的博客《The Scale step of Design a Distributed File System(DFS)》

浙公网安备 33010602011771号