1-6-0-总纲

以下是网络编程和I/O模型领域的核心知识原理及面试常见考点的详细总结。我将从网络基础、核心协议、Socket编程、I/O模型到高并发设计逐步展开，并穿插面试高频问题与解答思路。

一、网络基础与分层模型

1. 核心分层模型

OSI七层模型（理论标准）：物理层→数据链路层→网络层→传输层→会话层→表示层→应用层。
TCP/IP四层模型（实际应用）：网络接口层→网络层（IP）→传输层（TCP/UDP）→应用层（HTTP/FTP/DNS等）。
面试考点：
- 分层的设计思想（封装与解封装）。
- 每层核心功能（如传输层保证端到端可靠传输，网络层负责路由选择）。

二、传输层协议：TCP vs UDP

1. TCP（传输控制协议）

特点：面向连接、可靠传输、全双工通信。
可靠性实现机制：
- 序号与确认应答：每个数据包有唯一序列号，接收方返回ACK确认。
- 超时重传：未收到ACK时重发数据。
- 流量控制：通过滑动窗口动态调整发送速率，避免接收方缓冲区溢出。
- 拥塞控制：慢启动、拥塞避免算法应对网络拥堵。
适用场景：文件传输、HTTP/HTTPS、邮件等要求数据完整的场景。

2. UDP（用户数据报协议）

特点：无连接、不可靠传输、面向数据报、速度快。
适用场景：视频通话、直播、DNS查询、实时游戏等对延迟敏感的场景。

3. TCP与UDP核心区别（面试必考）

维度	TCP	UDP
连接性	面向连接（三次握手）	无连接
可靠性	可靠（不丢失、不乱序）	不可靠（可能丢包）
速度	较慢（机制复杂）	较快（无额外开销）
数据边界	无边界（字节流）	有边界（数据报）
应用场景	文件传输、Web访问	实时通信、广播/多播

三、Socket编程基础

1. Socket本质

定义：网络通信的端点，由IP地址+端口号唯一标识。
核心操作：创建Socket、绑定地址（bind）、监听连接（listen）、建立连接（connect）、数据收发（send/recv）、关闭连接（close）。

2. TCP Socket编程流程（Java示例）

服务器端：
1. 创建ServerSocket并绑定端口。
2. 调用accept()阻塞等待客户端连接。
3. 通过输入输出流读写数据。
4. 关闭资源。
客户端：
1. 创建Socket并指定服务器IP和端口。
2. 通过流读写数据。
3. 关闭连接。

3. UDP Socket编程流程

无连接：直接通过DatagramPacket发送数据报。
服务器端：创建DatagramSocket→接收数据报（receive）→处理并响应（sendto）。
客户端：创建DatagramSocket→发送数据报（sendto）→接收响应。

四、TCP深入问题（面试高频）

1. 三次握手与四次挥手

三次握手（建立连接）：
1. 客户端发送SYN（seq=x）。
2. 服务器回复SYN+ACK（seq=y, ack=x+1）。
3. 客户端发送ACK（ack=y+1）。
为什么需要三次？：确保双方收发能力正常，避免无效连接。
四次挥手（断开连接）：
1. 客户端发送FIN。
2. 服务器回复ACK（半关闭）。
3. 服务器发送FIN。
4. 客户端回复ACK。
为什么需要四次？：服务器可能还有未发送完的数据，不能立即关闭。

2. 粘包与拆包问题

产生原因：
- TCP是字节流协议，无消息边界。
- 发送方多次小数据包可能被合并（粘包），或大数据包被拆分（拆包）。
解决方案：
- 定长消息：每个包固定长度，不足补零（简单但浪费空间）。
- 分隔符：用特殊字符（如\r\n）分割（需转义数据中的分隔符）。
- 长度前缀：在数据包头部添加长度字段（最常用，如HTTP的Content-Length）。

五、I/O模型（高并发核心）

1. I/O操作的两个阶段

阶段1：等待数据准备好（从网络到内核缓冲区）。
阶段2：将数据从内核缓冲区复制到用户缓冲区。

2. 四种I/O模型对比

模型	阶段1	阶段2	同步/异步	特点与适用场景
阻塞I/O	阻塞	阻塞	同步	简单，但每连接需一线程，高并发资源消耗大。
非阻塞I/O	轮询（立即返回）	阻塞	同步	实时性好，但CPU占用高。
I/O多路复用	阻塞于select/epoll	阻塞	同步	单线程处理多连接，高并发首选（如Nginx、Redis）。
异步I/O	非阻塞	非阻塞	异步	内核完成所有操作后回调通知（如Windows IOCP）。

3. 关键技术详解

I/O多路复用：
- select/poll：遍历所有连接检查就绪状态，连接数多时效率低。
- epoll（Linux）：事件驱动，仅返回就绪的连接，高效支持海量连接。
触发模式：
- 水平触发（LT）：只要缓冲区有数据，持续通知。
- 边缘触发（ET）：状态变化时只通知一次，需一次读完数据。

六、高并发设计面试考点

1. 如何设计支持百万连接的服务器？

方案：I/O多路复用（epoll）+ 非阻塞I/O + 线程池。
避免方案：阻塞I/O（线程资源耗尽）或纯非阻塞I/O（CPU空转）。

2. 为什么Redis/Nginx使用单线程仍高性能？

核心：基于epoll的I/O多路复用，避免线程切换开销。

3. 异步IO的适用场景？

场景：大规模文件读写或网络操作（如云存储服务）。
Linux限制：Linux AIO不完善，实际高并发仍以epoll为主。

七、面试实战问题示例

TCP为什么是可靠传输？

→ 答：通过序号/确认、超时重传、流量控制、拥塞控制机制保证。
epoll比select优势在哪？

→ 答：epoll无需遍历所有连接，时间复杂度O(1)，支持海量连接。
粘包问题如何解决？

→ 答：常用长度前缀法，先读长度字段，再按长度读取数据。
阻塞I/O和异步I/O的本质区别？

→ 答：阻塞I/O的两个阶段都阻塞用户线程；异步I/O的两个阶段均由内核完成，通过回调通知用户。

八、总结与学习建议

核心关系：网络编程基础 → Socket API → TCP/UDP特性 → 高并发I/O模型 → 系统设计。
学习路径：先掌握TCP/IP协议和Socket编程，再深入I/O多路复用与并发模型。
面试重点：TCP可靠性、握手/挥手、粘包解决、I/O模型对比、epoll原理。

posted @ 2025-11-11 15:21 哈罗·沃德阅读(10) 评论(0) 收藏举报

刷新页面返回顶部