文件系统与文件读取全过程：从磁盘到内存

文件系统是操作系统用于组织、存储和管理计算机数据的一种机制，它定义了文件和目录的命名、存储和检索方式。常见的文件系统包括Ext4（Linux）、NTFS（Windows）和APFS（macOS）等。

让我们以一个进程读取文件/home/user/test.txt为例，详细说明从磁盘到内存的全过程：

// 用户程序调用read系统调用
int fd = open("/home/user/test.txt", O_RDONLY);
char buf[1024];
read(fd, buf, 1024);

• 触发read()系统调用，CPU从用户态切换到内核态

VFS层处理：
• 内核通过虚拟文件系统(VFS)接口接收请求• 解析路径"/home/user/test.txt"为inode
目录项缓存查找：
• 首先检查dentry缓存（dcache）是否缓存了该路径• 如果命中，直接获取对应的inode
逐级目录查找：
• 未命中则从根目录开始逐级查找： ◦ 查找"/“目录的inode（通常inode号为2） ◦ 在”/"的数据块中查找"home"对应的inode ◦ 在"home"目录中查找"user"对应的inode ◦ 最后在"user"目录中查找"test.txt"的inode

inode缓存查找：
• 检查inode缓存是否已缓存该文件的inode• 如果未缓存，从磁盘读取inode信息
磁盘读取inode：
• 根据文件系统布局计算inode位置： ◦ 超级块中包含inode表起始位置 ◦ inode号用于索引inode表• 触发磁盘I/O操作读取inode：

磁盘操作流程：
1. 磁头移动到正确磁道（寻道时间）
2. 等待扇区旋转到磁头下（旋转延迟）
3. 读取inode数据（传输时间）

• 读取过程中，进程可能被阻塞，CPU调度其他进程运行

• 检查进程是否有该文件的读权限

• 检查文件是否被锁定

• 从inode中提取数据块指针：

• 直接指针：指向前12个数据块（Ext4）

• 间接指针：指向包含更多块指针的块

• 双重间接指针：两级间接寻址

• 三重间接指针：三级间接寻址

页缓存检查：
• 首先检查页缓存(page cache)中是否已缓存所需数据• 如果命中（缓存命中），直接返回数据
触发磁盘I/O（缓存未命中）：
• 准备I/O请求： ◦ 根据文件块号计算磁盘物理位置（柱面/磁头/扇区） ◦ 构造bio结构（块I/O请求）• 通过块设备层提交请求：

中断处理流程：
1. 磁盘控制器收到请求，DMA引擎将数据直接传输到内存
2. 传输完成后，磁盘控制器触发硬件中断
3. CPU保存当前上下文，跳转到中断处理程序
4. 内核的中断处理程序确认I/O完成
5. 唤醒等待该I/O的进程
6. 恢复被中断的上下文

• 返回实际读取的字节数
• CPU从内核态切换回用户态
• 用户程序继续执行

文件系统通过精心设计的层次结构和缓存机制，将缓慢的磁盘I/O操作对用户体验的影响降到最低，同时保证了数据的完整性和安全性。从inode查找、权限检查到实际的磁盘读取和中断处理，每个步骤都体现了操作系统设计的精妙之处。

posted @ 2025-08-27 12:57 NeoLshu 阅读(25) 评论(0) 收藏举报来源

刷新页面返回顶部

neolshu