完整教程:Java NIO

IO 模型

IO指的是计算机与外部设备间交换数据的过程。比如磁盘,网络IO。
应用程序的IO分为两步:IO调用和IO执行。IO调用由应用程序发起,调用操作系统的 API,IO执行由操作系统内核执行。因为操作系统负责计算机资源的管理,不允许应用程序直接操纵。
进程的内存空间分为用户空间和内核空间。内核执行IO,等待IO设备准备好资料放入内核空间,之后将数据从内核空间拷贝到用户空间。

阻塞IO模型:
应用线程发起IO调用后,一直阻塞,直到内核将数据拷贝到用户空间为止。JAVA BIO 就是阻塞IO。
它的问题是:用户线程阻塞,为了并发执行多个IO,得一个线程池管理IO线程。线程的疑问是:占用内存资源多,线程上下文切换开销大,创建和销毁线程成本高。

非阻塞IO模型:
应用线程发起IO调用,立即返回结果(数据未就绪返回错误结果),不阻塞,称为非阻塞IO。这里的非阻塞是等待阶段不阻塞,操作系统内核将数据从内核空间拷贝到用户空间,应用线程仍然是阻塞的。
它的挑战是:应用线程频繁轮询,消耗大量 CPU 资源。

IO多路复用模型:
应用线程不主动轮询,而是等待内核准备好资料后主动通知应用线程。
资料描述符:程序打开一个资料或者创建新文件,内核向进程返回一个文件描述符。
框架提供的函数(select, poll, epoll)同时监控多个材料描述符,任何一个返回内核数据就绪,通知应用线程读取数据。

信号驱动模型:
应用线程向内核发送信号,内核资料就绪后,向应用线程发送信号。应用线程读取数据。

异步IO:
上面四个IO,应用线程读取数据(将素材从内核空间拷贝到用户空间)都是阻塞的。
异步IO,应用线程发起IO调用,立即返回结果。内核将素材拷贝到用户空间后,发送信号通知应用线程。

NIO

NIO(non-blockiong IO)是同步非阻塞IO。它的核心概念有三个:channel, buffer, selector.底层是IO多路复用模型。
它与 BIO 的区别是:

  1. NIO 面向缓冲区,BIO 面向流。
  2. NIO 是非阻塞的,BIO 是阻塞的。

阻塞和非阻塞强调程序在等待调用结果(消息,返回值)时的状态。
阻塞调用是指调用结果返回之前,当前线程会被挂起。调用线程只有在得到结果之后才会返回。
非阻塞调用指在不能立刻得到结果之前,该调用不会阻塞当前线程。 对于同步调用来说,很多时候当前线程还是激活的状态,只是从逻辑上当前函数没有返回而已,即同步等待时什么都不干,白白占用着资源。

消息通信机制 (synchronous communication/ asynchronous communication)。就是同步和异步强调的
同步,就是在发出一个"调用"时,在没有得到结果之前,该“调用”就不返回。但是一旦调用返回,就得到返回值了。换句话说,就是由“调用者”主动等待这个“调用”的结果。
而异步则是相反,"调用"在发出之后,这个调用就直接返回了,所以没有返回结果。换句话说,当一个异步过程调用发出后,调用者不会立刻得到结果。而是在"调用"发出后,"被调用者"通过状态、通知来通知调用者,或通过回调函数处理这个调用

Channel

channel 类似BIO的流,channel 是双向的。

buffer

buffer 是内容块,缓存数据,用户线程可以读取/修改 buffer 任意位置的资料。

selector

一个 channel 代表一个连接,selector 利用IO多路复用模型,用一个 selector 线程注册,监听多个 channel。减少多个线程各自处理 channel 的线程池开销。

Selector

一个工具可能要建立多个连接,如果为每个 channel 分配一个线程。大部分时间线程处于阻塞状态,浪费资源。
因此用一个 selector 线程管理多个 channel,channel 以事件注册到 selector。selector 单线程轮询检测事件,若是事件就绪,交给处理器处理。
selector 可以并发处理成百上千个客户端连接。

NIO 简化为四种IO事件:
可读 SelectionKey.OP_READ
可写 SelectionKey.OP_WRITE
连接 SelectionKey.OP_CONNECT
接收 SelectionKey.OP_ACCEPT

Reactor 模型

Reactor 模型也基于事件驱动的IO多路复用。分为:reactor 线程和 handler 处理器。
reactor 线程建立连接,监听IO事件,执行IO读写,分发到 handlers 处理业务。

单线程模型:
reactor 和 处理器共用一个线程,优点是逻辑简便,缺点是:
线程数量少,性能差。时间长的事件会阻塞其他事件。

多线程模型:
处理器交给线程池。reactor 单线程执行建立连接,监听IO事件,执行IO读写。
reactor 单线程处理IO事件,无法处理大量新连接,IO就绪事件。就是线程池使得 handler 非阻塞处理业务。缺点

主从多线程模型:
reactor 线程分为主从线程。主 reactor 线程只负责建立连接。从 reactor 线程负责监听/处理IO事件。从 reactor 也允许使用线程池。

Netty

NIO 没有屏蔽平台差异,且因此建议启用NIO 框架,比如 netty。

posted @ 2025-08-07 16:22  wzzkaifa  阅读(21)  评论(0)    收藏  举报