20145321 《信息安全系统设计基础》第九周学习总结

20145321 《信息安全系统设计基础》第九周学习总结

教材内容总结

Unix I/O

  • 一个Unix文件就是一个m个字节的序列:B0,B1,...,Bk,...,B(m-1)
  • 所有的I/O设备,如网络、磁盘、和终端,都被模型化为文件,而所有的输入和输出都被当做想对应的文件的读写来执行。这种将设备优雅的映射为文件的方式,允许Unix内核引出一个简单、低级的应用接口,称为UnixI/O,这使得所有的输入和输出都能以一种统一且一致的方式来执行。

    • 打开文件

      一个应用程序通过要求内核来打开文件,内核返回一个小的非负整数(描述符),内核记录有关这个文件的所有的信息,应用程序只需要记住这个描述符。

        Unix外壳创建的每个进程开始时都有三个打开的文件:
        标准输入(描述符为0)
        标准输出(描述符为1)
        标准错误(描述符为2)
        头文件:定义常量STDIN_FILENO、STDOUT_FILENO、STDERR_FILENO,用来代替显式的描述符
    • 改变当前的文件位置

      -对于每个打开的文件,内核保持着一个文件位置k,初始为0。这个位置是从文件开头起始的字节偏移量。

      -应用程序可以通过seek操作显式的设置文件的当前位置为k。

    • 读写文件

      读操作就是从文件拷贝n>0个字节到存储器,从当前文件位置k开始,然后将k增加到k+n。

      -给定一个大小为m字节的文件,k >= m 时执行读操作会触发一个称为end-of-file(EOF)的条件,应用程序能检测到这个条件,但是文件结尾处并没有明确的“EOF符号”。

      写操作就是从存储器拷贝n>0个字节到一个文件,从当前文件位置k开始,然后更新k。

    • 关闭文件

      -应用通知内核关闭这个文件。作为响应,内核释放文件打开时创建的数据结构,并将这个描述符恢复到可用的描述符池当中。

      -无论进程因为何种原因终止时,内核都会关闭所有打开的文件并释放他们的存储器资源。

打开和关闭文件

  • 打开文件

    • open函数将filename转换成一个文件描述符,并且返回描述符数字。返回的描述符总是在进程中当前没有打开的最小描述符。
    • flag参数

       表示访问方式额外提示
       O_RDONLY:只读。
       O_WRONLY:只写。
       O_RDWR:可读可写。
      
       一位或者多位掩码的或
       O_CREAT,表示如果文件不存在,就创建它的一个截断的文件。
       O_TRUNC:如果文件已经存在,就截断它。
       O_APPEND:在每次写操作前,设置文件位置到文件的结尾处。
    • mode参数:指定新文件的访问权限位。作为上下文的一部分,每个进程都有一个umask,通过调用umask函数设置。当进程通过带某个带mode参数的open函数用来创建一个新文件的时候,文件的访问权限位被设置为mode & ~umask。

       给定mode和umask的默认值:
       #define DEF_MODE   S_IRUSR|S_IWUSR|S_IRGRP|S_IWGRP|S_IROTH|S_IWOTH
       #define DEF_UMASK  S_IWGRP|S_IWOTH
  • 关闭文件
    • 若成功则返回0,不成功则为-1。
    • 关闭一个已经关闭的描述符程序会出错。
    • 访问权限位。在sys/stat.h中定义

读和写文件

  • 读函数

    #include<unistd.h>
    ssize_t read(int fd,void *buf,size_t n);
    若成功,返回读字节数,即实际传送的字节数量
    若EOF,返回0
    若出错,返回-1

    read函数从描述符为fd的当前文件位置拷贝最多n个字节到存储器位置buf。

  • 写函数

    #include<unistd.h>
    ssize_t write(int fd,const void *buf,size_t n);
    若成功,返回写的字节数
    若出错,返回-1

    write函数从存储器位置buf拷贝至多n个字节到描述符fd的当前文件位置。

  • 不足值

    • 在某些情况下,read和write传送的字节比应用程序要求的要少,这些不表示有错误。

      读时遇到EOF。假设准备读一个文件,该文件从当前文件位置开始只含有20个字节,若以50个字节的片进行读取,下一个read返回的不足值为20,此后的read将通过返回不足值0来发出EOF信号。
      
      从终端读文本行。若打开文件与终端相关联(如键盘和显示器),那么每个read函数将以此传送一个文本行,返回的不足值等于文本行大小。
      
      读和写网络套接字。若打开的文件对应于网络套接字,内部缓冲约束和较长的网络延迟会引起read和write返回不足值。(进程间的通信机制:对Unix管道调用read和write时,也有可能出现不足值)
    • 实际上除了EOF,在读写磁盘文件时,不会遇到不足值。
    • 如果想创建健壮的诸如web服务器这样的网络应用,就必须通过反复调用read和write处理不足值,直到所有需要的字节都传送完毕。

用RIO包健壮地读写

  • RIO包会自动处理不足值。RIO提供了两类不同的函数:
    • 无缓冲的输入输出函数。这些函数直接在存储器和文件之间传送数据,没有应用级缓冲,对将二进制数据读写到网络和从网络读写二进制数据尤其有用。
    • 带缓冲的输入函数。这些函数允许高效地从文件中读取文本行和二进制数据(函数从内部缓冲区中拷贝一个文本行,当缓冲区变空的时候,会自动地调用read重新填满缓冲区),这些文件的内容缓存在应用级缓冲区内,类似于像printf这样的标准I/O函数提供的缓冲区。带缓冲的RIO输入函数是线程安全的,它在同一个描述符上可以被交错地调用。

读取文件元数据

  • 应用程序能够通过调用stat和fstat函数,检索到关于文件的信息:元数据
    • stat函数以一个文件名作为输入
    • fstat函数以文件描述符作为输入
  • stat数据结构中的st_size成员包含了文件的字节数大小,st_mode成员编码了文件访问许可位和文件类型
  • 对于内核文本文件和二进制文件毫无区别

共享文件

  • 内核用三个相关的数据结构来表示打开的文件:

     描述符表:每个进程都它独立的描述符表,每个打来的描述符表指向文件表中的一个表项
     文件表:打开文件的集合是由一张文件表来表示的,所有的进程共享这张表
     v-node表:所有进程共享,每个表项包含stat结构中的大多数信息
  • 通过不同的打开文件表表项来引用两个不同的文件。没有共享文件,每个描述符对应一个不同的文件

  • 多个描述符也可以通过不同的文件表表项来引用同一个文件

I/0重定向

  • Unix外壳提供了I/O重定向操作符,允许用户将磁盘文件和标准输入输出联系起来
  • 重定向工作方式:使用dup2函数

     #include<unistd.h>
     int dup2(int oldfd,int newfd);
    • dup2函数拷贝描述符表表项oldfd到描述符表表项newfd,覆盖描述表表项newfd以前的内容。
    • 若newfd已经打开,dup2会在拷贝oldfd之前关闭newfd。

教材学习中的问题和解决过程

打完练习题10.1的代码进行编译时不通过

搜索到csapp.h是一堆头文件的打包,可以在http://csapp.cs.cmu.edu/public/code.html 下载

代码托管截图

代码托管

代码量统计

学习进度条

 代码行数(新增/累积)博客量(新增/累积)学习时间(新增/累积)
目标 3500行 30篇 300小时
第一周 50/50 1/2 10/10
第二周 120/170 1/3 20/30
第三周 130/300 1/4 20/50
第五周 130/430 2/6 25/75
第六周 50/480 2/8 25/100
第七周 53/533 1/9 20/120
第八周 0/533 2/11 15/135
第九周 68/601 2/13 20/155

posted on 2016-11-13 21:32  20145321曾子誉  阅读(100)  评论(2编辑  收藏  举报

导航