20145215《信息安全系统设计基础》第九周学习总结

20145215《信息安全系统设计基础》第九周学习总结

教材学习内容总结

  • 输入/输出是在主存和外部设备之间拷贝数据的过程,输入操作是从I/O设备拷贝数据到主存,输出操作是从主存拷贝数据到I/O设备。

Unix I/O

  • Unix文件:m个字节的序列
  • I/O设备:网络、磁盘和终端
  • Unix I/O :将设备映射为文件的方式,允许Unix内核引出一个简单、低级的应用接口。
  • 描述符:打开文件时,内核返回一个小的非负整数。 Unix外壳创建的每个进程开始时都有三个打开的文件:标准输入(描述符为0)、标准输出(描述符为1)、标准错误(描述符为2)。 改变当前的文件位置:文件位置为k,初始为0。 seek操作:显式地设置文件的当前位置为k。
  • EOF:是一个条件,而不是一个符号。
  • 关闭文件:内核释放文件打开时创建的数据结构,并将这个描述符恢复到可用的描述符池中。无论一个进程因为何种原因终止时,内核都会关闭所有打开的文件并释放它们的存储器资源。

打开和关闭文件

打开文件

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
int open(char *filename,int flags,mod_it mode);
- 若成功,返回值为新文件描述符
- 若出错,返回值为-1
  • open函数将filename转换成一个文件描述符,并且返回描述符数字。返回的描述符总是在进程中当前没有打开的最小描述符。
    fd = Open("文件名",flag参数,mode参数)

  • fd是返回的文件描述符(数字),总是返回在进程中当前没有打开的最小描述符。

  • flag参数:
    表示访问方式额外提示
    O_RDONLY:只读。
    O_WRONLY:只写。
    O_RDWR:可读可写。

    一位或者多位掩码的或
    O_CREAT,表示如果文件不存在,就创建它的一个截断的文件。
    O_TRUNC:如果文件已经存在,就截断它。
    O_APPEND:在每次写操作前,设置文件位置到文件的结尾处。

  • mode参数:指定新文件的访问权限位。作为上下文的一部分,每个进程都有一个umask,通过调用umask函数设置。当进程通过带某个带mode参数的open函数用来创建一个新文件的时候,文件的访问权限位被设置为mode & ~umask。
    给定mode和umask的默认值:
    #define DEF_MODE S_IRUSR|S_IWUSR|S_IRGRP|S_IWGRP|S_IROTH|S_IWOTH
    #define DEF_UMASK S_IWGRP|S_IWOTH

  • 出错的时候返回-1

关闭文件

	#include<unistd.h>
	int close(int fd);
  • 若成功则返回0,不成功则为-1。
  • 关闭一个已经关闭的描述符程序会出错。

访问权限位在sys/stat.h中定义

读和写文件

  • 应用程序是通过分别调用read和write函数来执行输入和输出的。
#include <unistd.h>
ssize_t read(int fd,void *buf,size_t n);
ssize_t write(int fd,const void *buf,size_t n);
  • read函数:从描述符为fd的当前文件位置拷贝最多n个字节到存储器位置buf。返回值:-1:一个错误;0:EOF;否则,返回值:实际传送的字节数量。
  • write函数:从存储器位置buf拷贝至多n个字节到描述符fd的当前文件位置。
#include "csapp.h"
int main(void)
{
    char c;
    while(Read(STDIN_FILENO,&c,1) != 0)
        Write(STDOUT_FILENO,&c,1);
    exit(0);
} 
  • lseek函数:应用程序能够显式地修改当前文件的位置。

  • 不足值:read和write传送的字节比应用程序要求的少。

  • 产生不足值的原因:

    • 读时遇到EOF
    • 从终端读文本行
    • 读和写网络套接字

用RIO包健壮地读写

  • RIO包的实质:I/O包
  • RIO包提供的两种函数:无缓冲的输入输出函数、带缓冲的输入函数(线程安全)

RIO的无缓冲的输入输出函数

  • 应用程序通过调用rioreadn和riowritten函数可以在存储器和文件之间直接传送数据。
#include "csapp.h"
ssize_t rio_readn(int fd,void *usrbuf,size_t n);
ssize_t rio_writen(int fd,void *usrbuf,size_t n);
  • rio_ readn函数在遇到EOF时,只能返回一个不足值;
  • rio_ writen函数绝不会返回不足值。

RIO的带缓冲的输入函数

  • 一个文本行就是一个由换行符结尾的ASCII码字符序列。在Unix系统中,换行符(‘\n')与ASCII码换行符(LF)相同,数字值为0x0a。

  • 实现计算文本文件中文本行的数量

    • 方法一:用read函数来一次一个字节地从文件传送到用户存储器,检查每个字节来查找换行符。这个方法的缺点是效率低,每读取文件中的一个字节都要求陷入内核。
    • 方法二:调用一个包装函数(rio_readlineb),它从一个内部读缓冲区拷贝一个文本行,当缓冲区变空时,会自动地调用read重新填满缓冲区。
    • 对于既包含文本行也包含二进制数据的文件,书上提供了一个rio_readn带缓冲区的版本:rio_readnb,它从和rio_readlineb一样的读缓冲区中传送原始字节。
rioreadinitb(riot *rp,int fd);
- 每打开一个描述符都会调用一次该函数,它将描述符fd和地址rp处的类型为rio_t的缓冲区联系起来。

rioreadnb(riot *rp,void *usrbuf,size_t n) ;
- 从文件rp中最多读n个字节到存储器位置usrbuf。对同一描述符,rioreadnb和rioreadlineb的调用可以交叉进行。

ssizet readlineb(riot *rp,void *usrbuf,size_t maxlen);
- 从文件rp中读取一个文本行(包括结尾的换行符),将它拷贝到存储器位置usrbuf,并用空字符来结束这个文本行。
  • RIO读程序的核心——rio_read函数

读取文件元数据

  • 应用程序能够通过调用stat和fstat函数,检索到关于文件的信息(元数据)。
#include <unistd.h>
#include <sys/stat.h>
int stat(cost char *filename,struc sta *buf);
int fstat(int fd,struct stat *buf);

- stat函数以文件名作为输入
- fstat函数以文件描述符作为输入
  • st_size成员包含了文件的字节数大小
  • st_mode成员编码了文件访问许可位和文件类型
  • Unix提供的宏指令根据st_mode成员来确定文件的类型
宏指令:S_ISREG()   普通文件?二进制或文本数据
宏指令:S_ISDIR()   目录文件?包含其他文件的信息
宏指令:S_ISSOCK()  网络套接字?通过网络和其他进程通信的文件

共享文件

  • 内核使用三个相关的数据结构来表示打开的文件:

    • 描述符表:每个打开的描述符表项指向文件表中的一个表项
    • 文件表:所有进程共享这张表,每个表项包括文件位置,引用计数,以及一个指向v-node表对应表项的指针
    • v-node表:所有进程共享这张表,包含stat结构中的大多数信息
  • 描述符各自引用不同的文件,没有共享文件。

  • 多个描述符通过不同的文件表表项引用同一个文件。

  • 子进程继承父进程打开文件。

I/O重定向

  • Unix外壳提供了I/O重定向操作符,允许用户将磁盘文件和标准输入输出联系起来
  • 重定向工作方式:使用dup2函数
#include<unistd.h>
int dup2(int oldfd,int newfd);
  • dup2函数拷贝描述符表表项oldfd到描述符表表项newfd,覆盖描述表表项newfd以前的内容。
  • 若newfd已经打开,dup2会在拷贝oldfd之前关闭newfd。

标准I/O和I/O函数

  • 应用程序可以通过open、close、lseek、read、write和stat这样的函数来访问Unix I/O。
    RIO函数:read和write的健壮的包装函数,自动处理不足值,为读文本行提供一种高效的带缓冲的方法。
    标准I/O函数:提供了Unix I/O函数的一个更加完整的带缓冲的替代品,包括格式化的I/O例程。是磁盘和终端设备I/O之选。

  • 套接字描述符:Unix对网络的抽象是一种称为套接字的文件类型,被称为套接字描述符。应用进程通过读写套接字描述符来与运行在其他计算机上的进程通信。

  • 对流I/O限制是:

    • 跟在输出函数之后的输入函数,必须在其中间插入fflush、fseek、fsetpos或者rewind函数,后三个函数使用Unix I/O中的lseek函数来重置当前的文件位置。
    • 跟在输入函数之后的输出函数,必须在中间插入fseek、fsetpos或者rewind的调用,一个输出函数不能跟随在一个输入函数之后,除非该输入函数遇到了一个EOF。
  • 解决对流I/O限制的方法是:

    • 采用在每个输入操作前刷新缓存区这样的规则来满足。
    • 对同一个打开的套接字描述符打开两个流,一个用来读,一个用来写。
  • 对套接字使用lseek函数是非法的。

  • 在网络套接字上,使用RIO函数更常见。

遇到的问题和解决过程

  • 问题:

    • 运行教材598页练习题10.1代码出现错误:
  • 解决:

    • 缺少csapp.h的头文件,这是书的作者编写的一个头文件,使用的时候要把此头文件csapp.h和csapp.c文件包含到你的系统中。先到网上下载这两个文件,下载地址(http://download.csdn.net/detail/tzasd89812/4206284);

    • 在命令行下输入sudo mv csapp.h csapp.c /usr/include指令将文件移到/usr/include中(需要用到sudo权限);

    • 打开csapp.h头文件,在#end if前面加上一句#include <csapp.c>,因为头文件要把csapp.c包含进去;

    • 由于csapp.c中包含线程的一部分,所以编译的时候要加上-lpthread选项,否则很多错误,此时编译运行:

    • 发现编译通过,但是无法运行可执行文件,之后将代码中的Open,Close换成了open和close,成功运行:

本周代码托管截图

  • 代码托管链接:click here
  • 托管截图及代码行数统计:

心得体会

通过对本章系统级I/O的学习,我了解到Unix内核引出的应用接口I/O的基本功能和使用方法,它允许应用程序打开、关闭、读和写文件、提取文件的元数据,以及执行I/O重定向。同时,这一章也为我们随后学习网络编程和并发性奠定坚实的基础,我相信等我们学完程序间的交互和通信部分时,我们对计算机系统以及它们对程序的影响会有更成熟的理解。

学习进度条

代码行数(新增/累积) 博客量(新增/累积) 学习时间(新增/累积) 重要成长
目标 5000行 30篇 400小时
第一周 0/0 1/2 25/45 学习了几个Linux核心命令
第二周 55/55 2/4 27/72 学会了vim,gcc以及gdb的基本操作
第三周 148/203 1/5 23/95 对信息的表示和处理有更深入的理解
第五周 72/275 1/6 25/120 对汇编语言有了更深的理解
第六周 56/331 2/8 30/150 安装了Y86模拟器
第七周 61/392 1/9 22/172 理解了局部性原理和缓存思想在存储层次结构中的应用
第八周 0/392 1/10 20/192 复习前几章内容
第九周 132/524 2/12 24/216 了解了Linux操作系统提供的基本I/O服务

参考资料

posted @ 2016-11-12 23:43  L.X.M  阅读(332)  评论(1编辑  收藏  举报