完整教程：技术演进中的开发沉思-109 Linux服务编程系列：I/O复用（下）

紧接上文继续聊聊I/O 复用，这些那些藏在技术文档背后的实用智慧。

一、非阻塞 connect

做支付网关时，最头疼的就是对接不同银行的服务器。传统的阻塞 connect 像守着电话等快递员 —— 打给 A 银行的电话没通，就只能死等，后面 B、C 银行的请求全堵在队列里。有次银行机房临时断网，大家的服务线程全卡在 connect 上，监控面板红得刺眼，运营同事拍着桌子问怎么回事，我攥着鼠标的手全是汗。

否真的连上了。就是后来才明白，非阻塞 connect 是另一种思路：就像同时给三个快递员发消息，不盯着某一个等回复，而是每隔几秒看眼手机 —— 谁先回了就先处理谁的包裹。在 Linux 里，我们先把 socket 设为非阻塞模式，调用 connect 后不管成功失败，函数都会立刻返回；接着用 select 监听这个 socket 的 “可写事件”，就像盯着手机等消息提醒；一旦监听到可写，再通过 getsockopt 检查连接状态，确认

这种方式彻底盘活了服务。之前一次只能处理一个连接，改成非阻塞后，一个线程能同时管理上百个连接请求。有次银行系统升级导致连接超时率飙升，但我们的服务没再卡死，而是优雅地跳过超时连接，优先处理能成功的请求，交易成功率反而比之前高了 15%。现在回想，非阻塞 connect 的精髓，其实是 “不钻牛角尖” 的处事哲学 —— 与其死等一个结果，不如把精力放在能推进的事情上。

二、聊天室程序

2010 年公司做内部协作工具时，我写过一个简易聊天室，现在想起来，那简直是 I/O 复用的 “活教材”。若是把聊天室比作茶馆，客户端就是茶客，服务器就是掌柜，而 I/O 复用就是掌柜手里的 “听声筒”—— 能同时听见哪个茶客要添水，哪个茶客在喊话，还能把 A 茶客的话传给全场。

（一）客户端

客户端的逻辑很便捷：就像茶客进店先喊 “掌柜的，我来了”（连接服务器），然后一手端茶杯（输入消息），一手贴耳朵（听别人说话）。但这里有个问题 —— 如果茶客一直盯着茶杯等水开（阻塞读键盘），就听不见别人说话了；反之一直贴耳朵（阻塞读服务器消息），又没法自己发言。

所以大家用 select 同时监听两个 “源头”：一个是键盘（STDIN_FILENO），一个是服务器连接的 socket。就像茶客左手放茶杯，右手放听声筒，哪个有动静就先处理哪个。一旦键盘有输入，就把消息发给服务器；一旦 socket 有消息（别人的发言），就打印到屏幕上。有次测试时，产品经理边打字边惊呼：“哎？我还没发完，别人的消息就弹出来了！” 我笑着说：“这就是‘一心二用’的门道。”

（二）服务器

服务器的角色更困难，要像掌柜一样记住所有茶客（保存客户端 socket），还要把 A 的话传给 B、C、D（消息广播）。早年我用 select 做服务器时，先创建一个监听 socket（像茶馆门口挂的 “营业中” 牌子），然后用一个数组保存所有已连接的客户端 socket。

每次 select 监听完，先看监听 socket 有没有动静 —— 有就是新茶客来了（新连接），赶紧迎客（accept），把新 socket 加入数组；再看其他客户端 socket—— 有动静就是茶客说话了（发消息），赶紧把消息读出来，再传给数组里所有其他 socket。就像掌柜听见角落茶客喊 “今天天气好啊”，立刻提高嗓门喊：“这位客官说今天天气好！” 全场都能听见。

有次销售团队用这个聊天室开远程会，20 多个人同时说话，服务器居然没卡 —— 后来看日志，select 每次轮询只用了几毫秒。现在虽然有 epoll、kqueue 这些更高效的 I/O 复用机制，但那段写聊天室的经历，让我彻底懂了：I/O 复用的核心，就是 “眼观六路、耳听八方” 的统筹能力。

三、同时处理 TCP 和 UDP 服务

2015 年做物联网项目时，我们需要服务器同时处理两种请求：一种是设备的控制指令（比如 “开灯”“调温度”），必须确保设备收到（TCP）；另一种是设备的状态上报（比如 “当前温度 25℃”），快比准重要，丢一两条没关系（UDP）。这就像医院同时开两个窗口：一个是挂号窗口（TCP），必须一人一号、依次办理，确保信息没错；另一个是取药通知窗口（UDP），护士喊一声 “3 号取药”，不管有没有人应，喊完就下一个，效率高。

哪个 socket 有动静：就是要让服务器同时处理这两种服务，关键是让 I/O 复用 “认得出” 不同的 socket。我们先创建一个 TCP 监听 socket（挂号窗口），再创建一个 UDP socket（取药通知窗口），然后把两个 socket 都加入 select 的监听集合。每次 select 返回后，先判断

新设备来 “挂号”（建立连接），accept 后用新的 TCP socket 和设备通信，发送控制指令；就是如果是 TCP 监听 socket 有动静，就

设备来 “报温度”（发状态），直接 recvfrom 读消息，不用建立连接，读完就存数据库。就是假设是 UDP socket 有动静，就

有次工厂里 100 多台设备同时上报状态，UDP 那边每秒接收 200 多条消息，TCP 这边还在稳定发送控制指令，服务器 CPU 利用率才 20%。当时运维同事拍我肩膀说：“没想到两种服务放一起，还能这么稳！” 其实这背后没什么秘诀，只是让合适的协议干合适的事，再用 I/O 复用把它们 “管” 起来 —— 就像医院不会让挂号窗口兼做取药通知，而是各司其职，效率才高。

四、超级服务 xinetd

启动一堆 “冷门服务”—— 比如 telnet、ftp，平时没人用，却占着内存和端口；万一忘了关，还可能有安全风险。直到后来用上 xinetd，才像给小区找了个 “智能门卫”—— 平时不用每个住户都开门迎客，有访客来了，门卫再喊对应的住户出来。就是早年运维服务器时，我最烦的就

（一）xinetd 配置文件

xinetd 的配置文件就像门卫手里的手册，写着 “哪个访客对应哪个住户”“住户什么时候在家”。比如配备 telnet 服务时，要写清楚：

service telnet：服务名叫 telnet（访客要找的人）；

socket_type = stream：用 TCP 连接（访客走大门，按门铃）；

wait = no：不用等住户处理完上一个访客（拥护多并发）；

user = root：住户是 root（谁来接待）；

server = /usr/sbin/in.telnetd：住户的住址（telnet 服务程序路径）。

把 “启动服务” 的逻辑标准化，不用每次都记一堆命令，就像门卫不用记每个住户的电话，查手册就行。就是有次我帮运维同事配置 xinetd 时，他指着配置文件说：“这比手动启动服务方便多了！想关哪个服务，注释掉一行就行。” 我点点头 —— 其实配置文件的本质，就

（二）xinetd 工作流程

xinetd 的工作流程特殊像门卫接待访客：

站岗：xinetd 启动后，会根据配置文件里的服务，监听对应的端口（比如 telnet 的 23 端口）—— 就像门卫站在小区门口，盯着对应住户的门铃；

接访：一旦有访客按门铃（客户端请求连接），xinetd 就查手册（配置文件），确认这个端口对应哪个服务；

叫人：xinetd 启动对应的服务进程（比如 in.telnetd），就像门卫给住户打电话：“有人找你！”；

移交：把客户端连接交给服务进程处理，自己回到岗位继续站岗 —— 就像门卫把访客领到住户门口，然后继续等下一个门铃；

收尾：服务进程处理完请求后退出，xinetd 不用管后续 —— 就像住户送完访客，门卫不用跟进。

有次服务器内存告急，我们把所有冷门服务都交给 xinetd 管理，内存占用一下子少了 30%。后来我跟年轻同事说：“xinetd 的聪明之处，在于‘不养闲人’—— 不用的服务就歇着，需要时再叫醒，这跟我们做技巧优化的思路一样：把资源用在刀刃上。”

最后小结

从非阻塞 connect 到 xinetd，这些 I/O 复用的高级应用，本质上都是 “消除资源分配” 的问题 —— 要么让等待更高效（非阻塞 connect），要么让管理更省心（聊天室、TCP/UDP 共存），要么让资源不浪费（xinetd）。就像我这二十多年的职业生涯，从写单线程程序到设计分布式系统，核心也不过是 “把对的设备用在对的地方”。毕竟，好的技能从来不是高高在上的公式，而是能消除实际问题的 “生活智慧”。未完待续.........

posted @ 2025-09-22 12:42 yxysuanfa 阅读(12) 评论(0) 收藏举报

刷新页面返回顶部

yxysuanfa