CSAPP 系统级I/O

系统级I/O

系统级I/O

Linux文件本质上是一个包含字节的序列，I/O设备都被模型化为文件，内核通过使用 Unix I/O这一接口，对文件进行操作

文件的类型

Linux目录层次构成的是一个树形结构，根节点为 \ 根目录

此处介绍三种最常见的文件

普通文件：分为文本文件和二进制文件。前者只含有 ASCII 和 Unicode 字符，采用LF格式，每一行以 '\n'结束；后者是其余的普通文件
目录：目录是存储了一组文件名到文件的映射的文件，存储的映射可以是一个目录。用.表示到自身的映射，..表示到父节点的映射
套接字：与另一个进程进行跨网络通信的文件

文件的打开关闭

open函数实现了打开或新建一个文件

open函数打开文件filename，采用flags的访问方式，当创建一个新文件时，mode参数指明了它的访问权限位

flags参数的取值可以如下：
ORDONLY OWRONLY ORDWR 分别表示只读，只写，同时读写
同时，还可以与以下值进行或运算：
O_CREAT O_TRUNC O_APPEND 分别表示创建新文件时截断(为空)，将当前文件截断，写改为在当前文件末尾追加

每个进程都有一个umask变量，可通过umask函数设置，当使用mode创建一个新文件时，它的权限为mode & ~umask
mode和umask的取值可以如下，同样支持或运算

open函数的返回值为一个整数的文件描述符。每个进程都会打开三个文件STDIN_FILENO，STDOUT_FILENO，STDERRO_FILENO，文件描述符分别为0，1，2

使用close函数，传入一个文件的描述符，就可以关闭该文件

文件的读写

其中，fd为对应文件的描述符，buf为从文件读的数据存放到的地址指针或要写入文件的数据的地址指针，n为最大读写字节数
值得注意的是，当能读的字节数小于要求的字节数n时，会读取剩下的所有字节，然后将文件读对应的指针指向文件的末尾

RIO包实现健壮的读写

当遇到EOF或者进行网络通信时，读写操作的字节数会比要求的要少，此时称产生了不足值。在网络编程中，我们需要处理这种不足值避免出错，所以需要实现一个RIO(Robust I/O)包

无缓冲的输入输出函数

直接在内存和文件之间传输数据，没有应用级缓冲

原型如下

实现如下，输入函数会在被信号中断后继续进行，使用了while循环反复调用read函数直到读入要求的字节数，除非遇到了EOF；输出函数类似

带缓冲的输入函数

先将从文件读的数据放入一个缓冲区内，当调用函数时，尝试从该缓冲区内读取数据，这样避免了反复系统调用read函数。例如检查是否换行时，我们需要调用字符串长次read函数，每次读入1字节，这样会反复进入内核。而采用带缓冲的输入，可以一次调用read读入多个字节，再遍历缓冲区检查是否有换行即可

函数原型如下