Netty | 第1章 Java NIO 网络编程《Netty In Action》

前言
1. Java 网络编程
2. 线程模型概述
最后

前言

参考资料：

《Netty In Action》；
B站《尚硅谷 Netty 视频教程》；

本系列为 Netty 学习笔记，本篇介绍总结Java NIO 网络编程。Netty 作为一个异步的、事件驱动的网络应用程序框架，也是基于NIO的客户、服务器端的编程框架。其对 Java NIO 底层 API 进行了封装，因此有必要对 Java 网络编程做个大概了解。本篇将重点放在 NIO 网络编程模型上，对 BIO 及 AIO 仅做简要说明；

1. Java 网络编程

最早期的 Java API（java.net）只支持由本地系统套接字库提供的阻塞函数，其弊端有：
- 一个线程只能处理一条连接；
- 在任何时候都可能有大量线程处于休眠状态，可能造成资源浪费；
- 需要为每个线程的调用栈分配内存；
- 上下文切换带来的开销会很麻烦；
2002年，JDK 1.4 在 java.nio 包中引入非阻塞 IO（NIO）。使用事件通知 API 以确定在一组非阻塞套接字中有哪些已经就绪能够进行 IO 相关的操作；
非阻塞 IO 的优势有：
- 使用较少线程便可处理许多连接，减少了内存管理和上下文切换带来的开销；
- 没有 IO 操作需要处理时，线程可以被用于其他任务；
Java 支持3中网络编程模式：BIO(同步阻塞型)、NIO(同步非阻塞型)、AIO(异步非阻塞型)；
- BIO：适用于连接数目较小且固定的架构；
- NIO：适用于链接数量多且连接比较短的架构；
- AIO：适用于连接数目多且连接比较长的架构；
BIO 以流的方式处理书局，NIO 以块的方式处理书局，块 IO 的效率比流 IO 高很多；

1.1 Javs NIO 基本介绍

NIO 的三大核心部分部分：Channel(通道)、Buffer(缓冲区)、Selector(选择器)；
- 每个 Channel 都会对应一个 Buffer；
- Selector 对应一个线程，一个线程对应多个 Channel；
- 多个 Channel 可以注册到一个 Selector；
- 程序切换到哪个 Channel 由事件 Event 决定；
- Selector 会根据不同的事件，在各个通道上切换；
- Buffer 就是一个内存块，底层是一个数组；
- 数据的读取和写入通过 Buffer，与 BIO 不同。BIO 要么是输入流，要么是输出流，不能双向，而 NIO 的 Buffer 是双向的；
- Channel 也是双向的，可以反映底层操作系统的情况；底层的操作系统通道就是双向的；

NIO 是面向缓冲区，或者面向块编程的；
NIO 可以做到用一个线程来处理多个操作；
HTTP 2.0 使用了多路复用技术，做到同一个连接并发处理多个请求；

1.2 缓冲区 Buffer

缓冲区本质是一个可以读写的内存块，可以理解成一个容器对象，该对象提供一组方法，可以更轻松地使用内存块；
缓冲期内置了一些机制，能够跟踪和记录缓冲区的状态变化情况；
Channel 提供从文件、网络读取数据的通道，但读取或写入的数据必须经由 Buffer；
Buffer 有四个通用属性：
- capacity：容量，即可以容纳的最大数据量；在缓存区创建时被设定并且不能改变；
- limit：表示缓冲区当前的终点，不能对缓冲区中超过Limit的部分进行读写（相当于哨兵）。而且Limit是可以修改的；
- position：当前的读/写位置，下一个要被读或写的元素的索引，每次读写缓冲区数据时都会改变改值，为下次读写作准备；
- mark：标记；

Buffer 类的通用方法：

public abstract class Buffer {
    //JDK1.4时，引入的api
    public final int capacity()//返回此缓冲区的容量
    public final int position()//返回此缓冲区的位置
    public final Buffer position (int newPositio)//设置此缓冲区的位置
    public final int limit()//返回此缓冲区的限制
    public final Buffer limit (int newLimit)//设置此缓冲区的限制
    public final Buffer mark()//在此缓冲区的位置设置标记
    public final Buffer reset()//将此缓冲区的位置重置为以前标记的位置
    public final Buffer clear()//清除此缓冲区, 即将各个标记恢复到初始状态，但是数据并没有真正擦除, 后面操作会覆盖
    public final Buffer flip()//反转此缓冲区
    public final Buffer rewind()//重绕此缓冲区
    public final int remaining()//返回当前位置与限制之间的元素数
    public final boolean hasRemaining()//告知在当前位置和限制之间是否有元素
    public abstract boolean isReadOnly();//告知此缓冲区是否为只读缓冲区

    //JDK1.6时引入的api
    public abstract boolean hasArray();//告知此缓冲区是否具有可访问的底层实现数组
    public abstract Object array();//返回此缓冲区的底层实现数组
    public abstract int arrayOffset();//返回此缓冲区的底层实现数组中第一个缓冲区元素的偏移量
    public abstract boolean isDirect();//告知此缓冲区是否为直接缓冲区
}

Buffer 类及其子类：

1.2 通道 Channel

BIO 中的 stream 是单向的，例如 FileInputStream 对象只能进行读取数据的操作，而 NIO 中的通道(Channel)是双向的，可以读操作，也可以写操作;
Channel 在 NIO 中是一个接口 public interface Channel extends Closeable{}；
常用的 Channel 类有： FileChannel 、 DatagramChannel 、 ServerSocketChannel 和 SocketChannel：
NIO 还支持通过多个 Buffer(即 Buffer 数组) 完成读写操作，即 Scattering 和 Gathering；

1.3 选择器 Selector

Java 的 NIO，用非阻塞的 IO 方式。可以用一个线程，处理多个的客户端连接，就会使用到 Selector(选择器)；
Selector 能够检测多个注册的通道上是否有事件发生；
如果有事件发生，便获取事件然后针对每个事件进行相应的处理。这样就可以只用一个单线程去管理多个通道，也就是管理多个连接和请求（IO多路复用技术）；
Netty 的 IO 线程 NioEventLoop 聚合了 Selector(选择器，也叫多路复用器)，可以同时并发处理成百上千个客户端连接；

1.4 NIO 非阻塞网络编程原理分析

当客户端连接时，会通过 ServerSocketChannel 得到 SocketChannel；
将 socketChannel 注册到 Selector 上（register 方法）；
注册后返回一个 SelectionKey，会和该 Selector 关联(集合)；
Selector 进行监听（select 方法），对于有事件发生的通道，将对应的 SelectionKey 加入到内部集合中并返回；
再通过 SelectionKey 反向获取 SocketChannel （方法 channel）；
可以通过得到的 channel，完成业务处理；

2. 线程模型概述

目前存在的线程模型有：
- 传统阻塞 IO 服务模型；
- Reactor 模式；根据 Reactor 的数量和处理资源池线程的数量不同，有3种典型的实现：
  - 单 Reactor 单线程；
  - 单 Reactor 多线程；
  - 主从 Reactor 多线程；
Netty 主要基于主从 Reactor 多线程模型做了一定的改进，其中主从 Reactor 多线程模型有多个 Reactor；

2.1 传统阻塞 IO 服务模型

特点：
- 采用阻塞 IO 模式获取输入的数据；
- 每个连接都需要独立的线程完成数据的输入，业务处理，数据返回；
问题：
- 当并发数很大，就会创建大量的线程，占用很大系统资源；
- 连接创建后，如果当前线程暂时没有数据可读，该线程会阻塞在 read 操作，造成线程资源浪费；

黄色的框表示对象，蓝色的框表示线程，白色的框表示方法(API)；

2.2 Reactor 模式

Reactor 模式又称：反应器模式、分发者模式(Dispatcher)、通知者模式(Notifier)；
特点：
- 基于 IO 复用模型：多个连接共用一个阻塞对象，应用程序只需要在一个阻塞对象等待，无需阻塞等待所有连接。当某个连接有新的数据可以处理时，操作系统通知应用程序，线程从阻塞状态返回，开始进行业务处理；
- 基于线程池复用线程资源：不必再为每个连接创建线程，将连接完成后的业务处理任务分配给线程进行处理；
说明：
- 通过一个或多个输入同时传递给服务处理器 ServiceHandler 的模式(基于事件驱动)；
- 服务器端程序处理传入的多个请求，并将它们同步分派到相应的处理线程，因此 Reactor 模式也叫 Dispatcher 模式；
- Reactor 模式使用IO复用监听事件，收到事件后，分发给某个线程(进程)，这点就是网络服务器高并发处理关键；
核心组成：
- Reactor：即：服务处理器 ServiceHandler：在一个单独的线程中运行，负责监听和分发事件，分发给适当的处理程序来对 IO 事件做出反应。它就像公司的电话接线员，它接听来自客户的电话并将线路转移到适当的联系人；
- Handlers：即：事件处理器 EventHandler：处理程序执行 I/O 事件要完成的实际事件，类似于客户想要与之交谈的公司中的实际官员。Reactor 通过调度适当的处理程序来响应 I/O 事件，处理程序执行非阻塞操作；
优点：
- 响应快，不必为单个同步时间所阻塞，虽然 Reactor 本身依然是同步的；
- 可以最大程度的避免复杂的多线程及同步问题，并且避免了多线程/进程的切换开销；
- 扩展性好，可以方便的通过增加 Reactor 实例个数来充分利用 CPU 资源；
- 复用性好，Reactor 模型本身与具体事件处理逻辑无关，具有很高的复用性；

黄色的框表示对象，蓝色的框表示线程，白色的框表示方法(API)；

2.3 单 Reactor 单线程模式

方案说明：
- Select 是前面 IO 复用模型介绍的标准网络编程 API，可以实现应用程序通过一个阻塞对象监听多路连接请求；
- Reactor 对象通过 select 监控客户端请求事件。收到事件后，通过 dispatch 进行分发；
- 如果建立连接请求，则 Acceptor 通过 accept 处理连接请求，然后创建一个 Handler 对象处理完成连接后的各种事件；
- 如果不是连接请求，则由 Reactor 分发调用连接对应的 handler 来处理；
- Handler 会完成：read → 业务处理 → send 的完整业务流程；
优点：
- 模型简单，没有多线程、进程通信、竞争的问题，全部都在一个线程中完成；
缺点：
- 性能问题，只有一个线程，无法完全发挥多核 CPU 的性能。Handler 在处理某个连接上的业务时，整个进程无法处理其他连接事件，很容易导致性能瓶颈；
- 可靠性问题，线程意外终止，或者进入死循环，会导致整个系统通信模块不可用，不能接收和处理外部消息，造成节点故障；
应用场景：
- 客户端的数量有限，业务处理非常快速。如：Redis 在业务处理的时间复杂度 O(1) 的情况；

黄色的框表示对象，蓝色的框表示线程，白色的框表示方法(API)；

2.4 单 Reactor 多线程模式

方案说明：
- Reactor 对象通过 select 监控客户端请求事件，收到事件后，通过 dispatch 进行分发；
- 如果建立连接请求, 则 Acceptor 通过 accept 处理连接请求，然后创建一个 Handler 对象处理完成连接后的各种事件；
- 如果不是连接请求，则由 Reactor 通过 dispatch 分发调用连接对应的 Handler 来处理；
- Handler 只负责响应事件，不做具体的业务处理，通过 read 读取数据后，会分发给后面的 Worker 线程池的某个线程处理业务；
- Worker 线程池会分配独立线程完成真正的业务，并将结果返回给 Handler；
- Handler 收到响应后，通过 send 将结果返回给 Client（图中未标出）；
优点：
- 可以充分的利用多核 cpu 的处理能力；
缺点：
- 多线程数据共享和访问比较复杂；
- Reactor 处理所有的事件的监听和响应，在单线程运行、高并发场景容易出现性能瓶颈；
- 黄色的框表示对象，蓝色的框表示线程，白色的框表示方法(API)；

2.5 主从 Reactor 多线程模式

方案说明：
- Reactor 主线程 MainReactor 对象通过 select 监听连接事件。收到事件后，通过 Acceptor 处理连接事件；
- 当 Acceptor 处理连接事件后，MainReactor 将连接分配给 SubReactor（多个）；
- SubReactor 将连接加入到连接队列进行监听，并创建 Handler 进行各种事件处理；
- 当有新事件发生时， Subreactor 就会调用对应的 Handler 处理；
- Handler 先 read 读取数据，然后分发给后面的 Worker 线程池处理；
- Worker 线程池分配独立的 Worker 线程进行业务处理，并返回结果；
- Handler 收到响应的结果后，再通过 send 将结果返回给 Client；
- Reactor 主线程可以对应多个 Reactor 子线程，即 MainRecator 可以关联多个 SubReactor；
优点：
- 父线程与子线程的数据交互简单职责明确，父线程只需要接收新连接，子线程完成后续的业务处理；
- 父线程与子线程的数据交互简单，Reactor 主线程只需要把新连接传给子线程，子线程无需返回数据；
缺点：
- 编程复杂度较高；
应用场景：
- 这种模型在许多项目中广泛使用，包括 Nginx 主从 Reactor 多进程模型，Memcached 主从多线程，Netty 主从多线程模型的支持；

黄色的框表示对象，蓝色的框表示线程，白色的框表示方法(API)；

2.6 Netty 模型

Netty 主要基于主从 Reactors 多线程模型做了一定的改进，其中主从 Reactor 多线程模型有多个 Reactor；
方案说明：
- Netty 抽象出两组线程池： BossGroup 专门负责接收客户端的连接、WorkerGroup 专门负责网络的读写；
- BossGroup 和 WorkerGroup 类型都是 NioEventLoopGroup 。NioEventLoopGroup 相当于一个事件循环组，这个组中含有多个事件循环，每一个事件循环是 NioEventLoop；
- NioEventLoop 表示一个不断循环的执行处理任务的线程，每个 NioEventLoop 都有一个 Selector，用于监听绑定在其上的 socket 的网络通讯；
- 每个 Boss NioEventLoop 循环执行的步骤有 3 步：
  - 轮询 accept 事件；
  - 处理 accept 事件，与 Client 建立连接，生成 NioScocketChannel，并将其注册到某个 Worker NIOEventLoop 上的 Selector；
  - 处理任务队列的其他任务，即 runAllTasks；
- 每个 Worker NIOEventLoop 循环执行的步骤有 3 步：
  - 轮询 read、write 事件；
  - 在对应 NioScocketChannel上进行处理 IO 事件，即 read、write 事件；
  - 处理任务队列的其他任务，即 runAllTasks；
- 每个 WorkerNIOEventLoop 处理业务时，会使用 pipeline(管道)，pipeline 中包含了 channel，即通过 pipeline 可以获取到对应通道，管道中维护了很多的处理器；

最后

新人制作，如有错误，欢迎指出，感激不尽！欢迎关注公众号，会分享一些更日常的东西！如需转载，请标注出处！

posted @ 2021-12-06 15:14 多氯环己烷阅读(348) 评论(0) 收藏举报

刷新页面返回顶部

多氯环己烷