磁盘和文件系统

 
以旧有的 Windows 观点来看,你可能会有一颗磁盘并且将他分割成为 C:, D:, E:槽,那个 C, D, E就是分割槽(partition)。
 
磁盘组成:
 
 
 
磁盘的第一个扇区(sector磁区)主要记录了两个重要癿信息,分别是:
主要启动记录区(Master Boot Record, MBR):可以安装开机管理程序的地方,有 446 bytes
分割表(partition table):记录整颗硬盘分割的状态,有 64 bytes
MBR 是很重要的,因为当系统在开机的时候会主动去读取这个区块的内容,这样系统就会知道你的程序放在哪里和该如何进行开机。
 
 
磁盘分区表(partition table)
开始磁柱和结束磁柱是文件系统的最小单位,也就是分割槽的最小单位。
 
 
由于分割表就只有 64 bytes 而已,最多只能容纳四笔分割的记录, 这四个分割的记录被称为主要(Primary)戒延伸(Extended)分割槽。
 
若将硬盘以长条形来看,然后将磁柱以柱形图来看,那么那 64 bytes 的记录区段有点像底下的图示:
 
几个重点信息:
  •  其实所谓的『分割』就是针对那个 64 bytes 癿分割表进行设定而已!
  •  硬盘默认的分割表仅能写入四组分割信息
  •  这四组分割信息我们称为主要(Primary)戒延伸(Extended)分割槽
  •  分割槽的最小单位为磁柱(cylinder)
  •  当系统要写入磁盘时,一定会参考磁盘分区表,才能针对某个分割槽进行数据的处理
 
在上图当中,我们知道硬盘的四个分割记录区仅使用到两个,P1 为主要分割,而 P2 则为延伸分割。请注意, 延伸分割的目的是使用额外的扇区来记录分割信息,延伸分割本身并不能被拿来格式化。
 
这五个由延伸分割继续切出来的分割槽,就被称为逻辑分割槽(logical partition)。
 
 
主要分割、延伸分割和逻辑分割的特性作个简单的定义:
  •  主要分割与延伸分割最多可以有四笔(硬盘的限制)
  •  延伸分割最多只能有一个(操作系统的限制)
  • 逻辑分割是由延伸分割持续切割出来的分割槽;
  •  能够被格式化后,作为数据存储的分割槽为主要分割与逻辑分割。延伸分割无法格式化;
  •  逻辑分割的数量依操作系统而丌同,在 Linux 系统中,IDE 硬盘最多有 59 个逻辑分割(5 号到 63 号), SATA 硬盘则有 11 个逡辑分割(5 号到 15 号)。
 
开机流程和MBR
 
CMOS 记录各项硬件参数目嵌入在主板上面的储存器,BIOS 则是一个写入到主板上癿一个韧体(firmware)(再次说明, 韧体就是写入到硬件上的一个软件程序)。这个 BIOS 就是在开机的时候,计算机系统会主动执行的第一个程序了。
 
 
简单的说,整个开机流程到操作系统之前的动作应该是这样的:
1. BIOS:开机主动执行的韧体,会认识第一个可开机的装置;
2. MBR:第一个可开机装置的第一个扇区的主要启动记录区块,内含开机管理程序;
3. 开机管理程序(boot loader):一支可读取核心档案来执行的软件;
4. 核心档案:开始操作系统的功能...
 
 
由上面的说明我们会知道,BIOS 与 MBR 都是硬件本身会支持的功能,至于 Boot loader 则是操作系统安装在 MBR 上面的一套软件了。由于 MBR 仅有 446 bytes 而已,因此这个开机管理程序是非常小而美的。 这个 boot loader 的主要任务有底下这些项目:
  1.  提供选单:用户可以选择不同的开机项目,这也是多重引导的重要功能!
  2.  载入核心档案:直接指向可开机的程序区段来开始操作系统;
  3.  转交其他 loader:将开机管理功能转交给其他 loader 负责。
 
 
我们将上图作个总结:
  •  每个分割槽都拥有自己的启动扇区(boot sector)
  •  图中的系统槽为第一及第二分割槽,
  •  实际可开机的核心档案是放置到各分割槽内的!
  •  loader 只会认识自己的系统槽内的可开机核心档案,以及其他 loader 而已;
  •  loader 可直接指向或者是间接将管理权转交给另一个管理程序。
 
 
 
所谓的目录树架构(directory tree)就是以根目录为主,然后向下呈现分支状的目录结构的一种档案架构。 所以,整个目录树架构最重要的就是那个根目录(root directory),这个根目录的表示方法为一条斜线『/』, 所有的档案都与目录树有关。
 
现在的问题是『如何结合目录树的架构与磁盘内的数据』呢? 这个时候就牵扯到『挂载(mount)』的问题?
所谓的『挂载』就是利用一个目录当成进入点,将磁盘分区槽的数据放置在该目录下; 也就是说,进入该目录就可以读取该分割槽的意思。这个动作我们称为『挂载』,那个进入点的目录我们称为『挂载点』。 由于整个 Linux 系统最重要的是根目录,因此根目录一定需要挂载到某个分割槽的。 至于其他的目录则可依用户自己的需求来给予挂载到不同的分割槽。下图来作为一个说明:
 
 
文件系统
 
文件系统是操作系统用于明确磁盘或分区上的文件的方法和数据结构;即在磁盘上组织文件的方法。也指用于存储文件的磁盘或分区,或文件系统种类。
 
文件系统通常会将这两部分的数据分别存放在不同的区块,权限与属性放置到 inode 中,至于实际数据则放置到 data block 区块中。 另外,还有一个超级区块 (superblock) 会记录整个文件系统的整体信息,包括 inode 与 block 的总量、使用量、剩余量等。每个 inode 与 block 都有编号,至于这三个数据的意义可以简略说明如下:
  •  superblock:记彔此 filesystem 的整体信息,包括 inode/block 的总量、使用量、剩余量, 以及文件系统的格式与相关信息等;
  •  inode:记彔档案的属性,一个档案占用一个 inode,同时记彔此档案的数据所在的 block 号码;
  •  block:实际记彔档案的内容,若档案太大时,会占用多个 block 。
 
这种数据存储的方法我们称为索引式文件系统(indexed allocation)
 
 
 
 
文件系统高达数百 GB 时, 那么将所有的 inode 与 block 通通放置在一起将是很不明智的决定,因为 inode 与 block 的数量太庞大,不容易管理。因此 Ext2 文件系统在格式化的时候基本上是区分为多个区块群组 (block group) 的,每个区块群组都有独立的 inode/block/superblock 系统。
 
 
 
 
inode
  •  每个 inode 大小均固定为 128 bytes;
  •  每个档案都仅会占用一个 inode 而已;
  •  承上,因此文件系统能够建立的档案数量不 inode 的数量有关;
  •  系统读取档案时需要先找到 inode,并分析 inode 所记彔的权限与用户是否符合,若符合才能够开始实际读取 block 的内容。
inode的内容:
  •  该档案的存取模式(read/write/excute);
  •  该档案的拥有者与群组(owner/group);
  •  该档案的容量;
  •  该档案建立或状态改变的时间(ctime);
  •  最近一次的读取时间(atime);
  •  最近修改的时间(mtime);
  •  定义档案特性癿flag,如 SetUID...;
  •  该档案真正内容的指向 (pointer);
 
 
档案的读取流程为(假设读取者身份为 vbird 这个一般身份使用者):
1. / 的 inode:
透过挂载点的信息找到 /dev/hdc2 的 inode 号码为 2 的根目彔 inode,且 inode 规范的权限
让我们可以读取该 block 的内容(有 r 不 x) ;
2. / 的 block:
经过上个步骤取得 block 的号码,并找到该内容有 etc/ 目彔的 inode 号码 (1912545);
3. etc/ 的 inode:
读取 1912545 号 inode 得知 vbird 具有 r 不 x 癿权限,因此可以读取 etc/ 的 block 内容;
4. etc/ 的 block:
经过上个步骤叏得 block 号码,并找到该内容有 passwd 档案的 inode 号码 (1914888);
5. passwd 的 inode:
读取 1914888 号 inode 得知 vbird 具有 r 的权限,因此可以读取 passwd 的 block 内容;
6. passwd 的 block:
最后将该 block 内容的数据读出来。
 
 
 

posted on 2013-05-22 11:47  wacao  阅读(481)  评论(0编辑  收藏  举报

导航