操作系统概念学习笔记 第十六章 分布式文件系统
背景:
分布式系统是一个通过通信网络相互连接的松散结合的机器集合。
术语DFS通常表示分布式文件系统。
服务时运行在一个或多个机器上的软件实体,它为某个事先未知的客户提供某种类型的功能。
服务器是运行在单个机器上的服务软件。
客户是指能通过一组操作来调用某个服务的进程,这些操作构成了客户接口。
机器间的接口是指底层的接口为机器间交互而定义的。
文件系统是用来为客户提供文件服务的,一个文件服务的客户接口由一系列简单的文件原语操作组成,文件服务控制的主要硬件是一组本地辅助存储设备。一个DFS的客户机、服务器和存储设备都分散在分布式系统的机器上。
衡量DFS最重要的性能指标是满足服务请求所需的时间。
DFS管理的所有存储空间由不同的、远程的、小的存储空间所组成。
命名和透明性:
命名是在逻辑对象和物理对象之间建立的映射。
命名结构:
位置透明性:文件名字不揭示任何有关文件物理存储位置的线索
位置独立性:当文件的物理存储位置改变时,不需要改变文件名
命名方案:
远程文件访问:
基本缓存设计:
缓存位置:
主存储缓存具有几个优点:
1 主存储缓存允许工作站无盘化
2 从主存储缓存中可以比从磁盘缓存上更快地访问数据
3 目前的技术趋势是朝着更大、更便宜的主存储器发展,获得的性能加速将会超过磁盘缓存的优点
4 不管用户缓存位于何处,服务器缓存将在主存储器中
缓存更新策略:
用于将更改的数据块写回服务器主拷贝的策略对系统的性能和可靠性具有关键性的影响。
1 直写策略:一旦有数据被放置在缓存中,就将它们写到磁盘上。可靠性好,但是需要每次写访问等待,直到信息被送到服务器,所以它导致较差的写性能。等同于使用远程服务来写访问,及利用缓存进行只读访问。
2 延迟写策略:更新被写到缓存,稍后才被写到服务器。写访问完成得更快。数据可在被写回之前被重写,此时只有最后的更新需要写。存在可靠性问题。
一致性:
两种方法用来验证缓存数据的有效性:
1 客户机发起的方法:客户机发起一次有效性检查,它与服务器联系,并检查本地数据与主拷贝是否一致。有效性检查的频率是此方法的关键,并决定其所产生的一致性语义。
2 服务器发起的方法:服务器为每个客户机记录它缓存的文件,当服务器检测到一个潜在的不一致时,它必须有所反应。
高速缓存和远程服务的对比:
1 当使用缓存时,本地缓存能有效地处理许多远程访问。当使用远程服务方法时,每次远程访问都要跨越网络进行,结果可能产生网络阻塞、服务器超载,性能不好
2 网络总开销在传输大块数据时要比对个别请求的一系列响应传输时低。
3 cache一致性问题是缓存技术的主要困难。对不常写入的访问模式,缓存技术是很有效地,但当写入频繁时,用来克服一致性问题的机制反而导致了大量诸如性能、网络流量以及服务器负荷的开销。
4 因此缓存技术应在有本地磁盘或大主存的机器上实现。
5 缓存技术中,由于数据在服务器和客户机之间整体传输,而不是响应一个特殊的文件操作需求,因此机器间的界面不同于上级的用户界面。而远程服务方式不过是本地文件系统界面在网络上的扩展,因此,机器间的界面反映了本地用户文件系统界面。
有状态服务和无状态服务:
对服务器端地信息处理有两种方式
1 服务器跟踪被每个客户机所访问的每个文件,
2 服务器不必了解数据块的用途而直接提供客户机请求的数据块
文件复制
不同机器上的复制文件对于提高有效性而言是有用的冗余,
复制设计的基本条件是同一文件的不同副本应驻留在彼此故障独立的机器上。

浙公网安备 33010602011771号