5种IO模型

Unix下可用的5种I/O模型分别是:

  • 阻塞IO
  • 非阻塞IO
  • IO复用(select和poll)
  • 信号驱动式IO(SIGIO)
  • 异步IO(POSIX的aio系列函数)
 
阻塞式I/O模型: 
 
 
 
本例子中,我们吧recvfrom函数视为系统调用,为的是区分应用进程和内核,不论它是如何实现的。在上图中,进程调用recvfrom,其系统调用直到数据报到达且被复制到应用进程的缓存或者发生错误才会返回。进行在recvfrom开始到它返回的整段时间内是被阻塞的,recvfrom成功返回后,应用进程开始处理数据报。
 
在调用recvfrom到返回,可以分为两个过程:
  • 内核等待数据
  • 把数据从内核复制到用户空间。
 
可以看到使用阻塞式IO在进行在上面两个过程中都处于等待(阻塞)当中。后面讲到的其他模型和阻塞IO的区别就在于不同的方式处理上面两个进程。
 
非阻塞IO
 
 
 
非阻塞IO和阻塞IO的最大区别在于等待数据这个过程,在阻塞IO中内核处于等待数据的过程中,进程是处于阻塞状态的。而在非阻塞IO中不会阻塞,当数据报没有准备好的时候,会直接返回一个EWOULDBLOCK错误。应用程序像这样对一个非阻塞描述符循环调用recvfrom时,我们称之为轮询,但是持续轮询内核以查看某个操作是否就绪,往往浪费大量的cpu时间。
 
IO复用(select和poll)
 
 
相比阻塞IO,IO复用把等待数据和复制数据到用户缓存区两个操作分开做了,需要两次系统调用。这样看来IO复用不具有什么优势,事实上select的优势在于我们可以等待多个描述符就绪。(socket数据或者是文件数据)
 
JAVA中我们用到的select所对应的IO模型就是IO复用模型。
 
信号驱动式IO(SIGIO)
 
 
 
我们首先开启套接字的信号驱动式IO功能,并且通过sigaction系统调用安装一个信号处理函数,该系统调用立刻返回,我们的进行继续工作。
 
当数据准备好之后,内核就为该进程产生一个SIGIO信号,这个时候进程就知道数据准备好了,可以让内核进行复制数据到用户空间操作了。
 
这个模式比起阻塞IO来说,等待数据这步不需要阻塞。
 
 
异步IO(POSIX的aio系列函数)
 
 
 
应用程序先进行一次系统调度,告诉内核需要监听的描述符,缓存区指针,缓存区大小,文件偏移,该系统调度立马返回。待内核把数据准备好,并且复制到用户空间了,再通知进程,在异步IO中,进程完全不需要阻塞。
 
上面看到的四种模式,在复制数据到用户空间这个过程中,进程都需要阻塞的,唯独异步IO在这个过程中,不需要阻塞。
 
 
 
模型对比
 
 
POSIX把两个属于定义如下:
同步IO操作:导致请求进程阻塞,直到IO操作完成。
异步IO操作:不导致请求阻塞。
 
可以得出结论,阻塞IO,非阻塞IO,复用IO,信号驱动式IO都为同步IO操作,异步IO模型与POSIX的异步IO操作匹配。
 
 
select函数
 
 
 
简单介绍下入参,中间的三个参数readset,writeset,exceptset指定我们要让内核测试读,写和异常条件的描述符。 timeout指定的是超时时间。maxfdpl是最大描述符数。
 
那么什么情况下内核会认为描述符可读或者可写或者异常呢。如下图:
 
 
 
另外,POSIX定义的pselect函数把时间精度从微妙增加到纳秒级,并采用一个指向信号集的指针作为它的一个参数。当有信号需要捕获时,该参数能够让我们避免竞争条件。
 
poll函数提供类似于select的功能,不过能够为流设备提供额外的信息。
 
 
 
以上内容主要是《UNIUX网络编程》关于IO模型章节的一个笔记。
 
posted @ 2015-03-22 17:11  albeter  阅读(466)  评论(0编辑  收藏  举报