Python 套接字编程从入门到精通：全面指南与实践

套接字在网络编程中占据核心地位，是实现网络通信的关键技术。本文作为 Python 套接字编程的深度教程，将深入剖析套接字的概念、创建、使用、数据传输、连接管理以及阻塞与非阻塞模式等方面的知识。通过丰富的代码示例、清晰的图表和对比表格，帮助读者全面掌握 Python 套接字编程技能，能够根据不同的网络需求开发出高效、稳定的网络应用程序。

一、套接字基础

（一）套接字概述

套接字是网络通信的基石，在网络编程中应用广泛。本教程主要聚焦于 INET（如 IPv4 地址族）和 STREAM（即 TCP）类型的套接字，这两种类型覆盖了绝大多数的套接字使用场景。套接字可分为 “客户端” 套接字和 “服务端” 套接字，客户端套接字用于发起连接和通信，服务端套接字则像总机接线员，负责监听连接请求并创建新的客户端套接字。

（二）套接字的历史

套接字起源于 Unix 的 BSD 分支，诞生于 Berkeley。因其与 INET 的完美结合，使得跨平台通信变得相对简单，迅速在互联网上传播开来，成为最流行的进程间通信（IPC）方式之一。在跨平台通信领域，套接字具有无可替代的地位，尽管在某些特定平台可能存在其他更快的 IPC 形式，但套接字凭借其通用性脱颖而出。

二、创建套接字

（一）客户端套接字创建

在 Python 中，使用socket模块创建客户端套接字。例如，当浏览器访问网页时，会执行以下操作：

import socket
# 创建一个INET, STREAMing套接字
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 连接到web服务器80端口 - 标准的http端口
s.connect(("www.python.org", 80))

上述代码首先通过socket.socket()函数创建一个基于 IPv4（AF_INET）和 TCP（SOCK_STREAM）的套接字对象s ，然后使用connect()方法连接到指定的服务器和端口（这里是www.python.org的 80 端口）。客户端套接字通常用于一次或一组数据交换，完成任务后会被销毁。

（二）服务端套接字创建

服务端创建套接字的过程相对复杂一些：

import socket
# 创建一个INET, STREAM套接字
serversocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 将套接字绑定到一个全局的主机和知名的端口
serversocket.bind((socket.gethostname(), 80))
# 成为服务器套接字，监听连接请求
serversocket.listen(5)

在这段代码中，首先创建了一个服务端套接字serversocket ，接着使用bind()方法将其绑定到指定的主机（这里使用socket.gethostname()获取本地主机名，也可使用'localhost'或'127.0.0.1'绑定到本地回环地址，若使用''则表示可以接受任何地址的连接）和端口（80 端口为 HTTP 服务的常用端口，但实际开发中为避免冲突，建议使用高位端口号）。最后，通过listen()方法使套接字进入监听状态，参数5表示允许在队列中累积最多 5 个连接请求，超过这个数量的请求将被拒绝。

服务端在创建套接字并监听端口后，进入主循环来处理客户端连接请求：

while True:
    # 接受外来的连接
    (clientsocket, address) = serversocket.accept()
    # 这里可以使用clientsocket执行一些操作，例如开启新线程处理连接
    # 在本场景中，我们假装这是个线程化服务器
    # 实际应用中需要导入threading模块并创建新线程
    # ct = threading.Thread(target=handle_client, args=(clientsocket,))
    # ct.start()
    pass

在这个循环中，serversocket.accept()方法会阻塞等待客户端的连接请求，一旦有客户端连接，它会返回一个新的客户端套接字clientsocket和客户端的地址address 。之后可以使用clientsocket与客户端进行通信，实际应用中通常会开启新线程或使用其他方式（如非阻塞模式、select库）来处理每个客户端连接，以实现并发处理多个客户端请求的能力。

三、进程间通信

在同一台机器上进行进程间通信（IPC）时，如果追求快速通信，可以考虑使用管道或共享内存。若选择使用 AF_INET 类型的套接字进行本地 IPC 通信，可将 “服务端” 套接字绑定到'localhost' 。在大多数平台上，这样做会利用本地回环地址，实现高效的内部通信。此外，Python 的multiprocessing模块提供了跨平台的 IPC 高层 API，方便开发者进行复杂的进程间通信操作。

通信方式	特点	适用场景	示例代码
管道	简单高效，适用于父子进程间通信	数据传输量较小、对实时性要求较高的场景	`import os; r, w = os.pipe(); pid = os.fork(); if pid == 0: os.close(r); w.write(b'Hello from child'); os.close(w); else: os.close(w); data = os.read(r, 1024); os.close(r); print(data)`
共享内存	直接在内存中共享数据，速度极快	需要频繁大量数据共享的场景	`from multiprocessing import shared_memory; shm = shared_memory.SharedMemory(create=True, size=1024); buffer = shm.buf; buffer[:] = b'Hello shared memory'; # 其他进程可通过相同名称访问共享内存`
基于套接字（绑定localhost）	利用网络通信机制，可跨平台	需要借助网络通信协议进行本地进程间通信的场景	`import socket; serversocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM); serversocket.bind(('localhost', 8888)); serversocket.listen(5); while True: (clientsocket, address) = serversocket.accept(); # 处理连接`
`multiprocessing`模块	提供高层 API，方便跨平台操作	复杂的进程间通信需求，如分布式计算	`from multiprocessing import Process, Queue; def worker(q): q.put('Hello from worker'); if __name__ == '__main__': q = Queue(); p = Process(target=worker, args=(q,)); p.start(); result = q.get(); p.join(); print(result)`

四、使用套接字

（一）通信方式选择

套接字通信有两组常用的方法：send和recv，以及将客户端套接字转换为文件类型后使用的read和write方法（在 Java 中常用）。使用read和write方法时，需要注意调用flush方法来确保数据及时发送，否则可能因数据滞留在输出缓冲区而导致接收方等待响应超时。

（二）数据传输处理

send和recv方法操作网络缓冲区，它们不一定能一次性处理所有期望发送或接收的字节，而是在网络缓冲区有空间或有数据可读时返回，并告知处理的字节数。因此，在使用时需要通过循环不断调用，直到所有数据处理完毕。当recv方法返回 0 字节时，表示连接的另一端已关闭连接，此时不能再从该连接获取数据，但仍可成功发送数据（在某些情况下）。

对于不同的应用场景，消息的处理方式有所不同。例如，HTTP 协议使用一个套接字进行一次传输，客户端发送请求后读取响应，然后销毁套接字，通过接收 0 字节序列来检测响应的结束。而若要复用套接字进行后续传输，则需要考虑消息的界定问题，常见的解决方案有：

定长消息：发送方和接收方约定消息的固定长度，接收方按固定长度接收数据。例如：

class MySocket:
    def __init__(self, sock=None):
        if sock is None:
            self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
        else:
            self.sock = sock
    def connect(self, host, port):
        self.sock.connect((host, port))
    def mysend(self, msg):
        totalsent = 0
        MSGLEN = 1024  # 假设消息固定长度为1024字节
        while totalsent < MSGLEN:
            sent = self.sock.send(msg[totalsent:])
            if sent == 0:
                raise RuntimeError("socket connection broken")
            totalsent = totalsent + sent
    def myreceive(self):
        chunks = []
        bytes_recd = 0
        MSGLEN = 1024
        while bytes_recd < MSGLEN:
            chunk = self.sock.recv(min(MSGLEN - bytes_recd, 2048))
            if chunk == b'':
                raise RuntimeError("socket connection broken")
            chunks.append(chunk)
            bytes_recd = bytes_recd + len(chunk)
        return b''.join(chunks)

消息类型与长度结合：让消息的第一个字符表示消息类型，根据类型确定消息的长度。这种方式需要进行两次recv操作，第一次获取消息类型及长度信息，第二次循环接收剩余的消息内容。
使用分界符：在消息中添加特定的分界符来标识消息的结束，接收方按块接收数据，并扫描分界符来确定消息的边界。例如，使用'\n'作为分界符：

def receive_with_delimiter(sock, delimiter=b'\n'):
    data = b''
    while True:
        chunk = sock.recv(1024)
        if not chunk:
            break
        data += chunk
        while delimiter in data:
            msg, data = data.split(delimiter, 1)
            yield msg

消息前缀表示长度：在消息前添加表示长度的前缀（如固定长度的数字字符），接收方先接收长度信息，再根据长度接收完整的消息内容。但这种方式在高网络负载下，可能无法一次接收完整的长度信息，需要使用两个recv循环处理。

五、二进制数据处理

在网络通信中，不同机器的二进制数据格式可能不同，例如网络字节顺序是大端序（最大字节在前），而常见的处理器（如 x86/AMD64、ARM、RISC-V）多为小端序（最小字节在前）。为确保数据在不同机器间正确传输，Socket 库提供了转换 16 位和 32 位整数的函数，如ntohl（网络字节序转主机长整型）、htonl（主机长整型转网络字节序）、ntohs（网络字节序转主机短整型）、htons（主机短整型转网络字节序）。在 64 位机器中，二进制数据的 ASCII 表示在很多情况下比二进制表示占用空间更小，开发者需要根据具体情况选择合适的表示方式。

六、连接管理

（一）断开连接操作

在关闭套接字之前，严格来说应该先调用shutdown方法。shutdown方法可以向套接字另一端发送不同的信号，如shutdown(1)表示 “此端已完成发送，但仍可以接收” 。然而，在大多数情况下，套接字库和程序员习惯忽略这一礼节，因为通常close操作的效果与shutdown(); close()类似。不过，在某些场景（如 HTTP 交换）中，合理使用shutdown可以提高通信的可靠性和效率。例如，客户端发送请求后执行shutdown(1) ，服务器通过接收 0 字节检测到 “EOF”，从而确定已接收到完整的请求，然后发送回复。

（二）套接字销毁时机

当使用阻塞套接字时，如果连接的另一端异常下线（未调用close），套接字可能会挂起。由于 TCP 是可靠协议，在放弃连接前会等待较长时间，如果在多线程环境中，相关线程可能会被阻塞，导致线程资源无法有效释放。但此时不建议尝试杀死线程，因为线程的资源回收机制与进程不同，强行杀死线程可能会破坏整个进程。因此，在完成通信后，务必及时调用close方法关闭套接字，避免出现资源占用和连接异常等问题。

七、非阻塞套接字与 select 库

（一）非阻塞套接字设置

在 Python 中，通过socket.setblocking(False)方法可以将套接字设置为非阻塞模式。在 C 语言中，设置非阻塞模式的操作更为复杂，需要在O_NONBLOCK（BSD 风格）和O_NDELAY（POSIX 风格，与TCP_NODELAY不同）之间进行选择。非阻塞套接字的主要特点是send、recv、connect和accept等操作可以在未完成任何数据传输时立即返回。

（二）使用 select 库进行多路复用

为了更有效地处理非阻塞套接字，可使用select库。在 Python 中，select库的使用相对简单：

import select
import socket

# 创建套接字并设置为非阻塞模式
serversocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
serversocket.setblocking(False)
serversocket.bind((socket.gethostname(), 8888))
serversocket.listen(5)

potential_readers = [serversocket]
potential_writers = []
potential_errs = []

while True:
    ready_to_read, ready_to_write, in_error = select.select(potential_readers, potential_writers, potential_errs, 1)
    for sock in ready_to_read:
        if sock == serversocket:
            (clientsocket, address) = serversocket.accept()
            clientsocket.setblocking(False)
            potential_readers.append(clientsocket)
        else:
            data = sock.recv(1024)
            if data:
                # 处理接收到的数据
                print(f"Received: {data} from {sock.getpeername()}")
            else:
                potential_readers.remove(sock)
                sock.close()
    for sock in ready_to_write:
        # 尝试发送数据
        pass
    for sock in in_error:
        potential_readers.remove(sock)
        potential_writers.remove(sock)
        sock.close()

在上述代码中，首先创建一个非阻塞的服务端套接字，并将其添加到potential_readers列表中。然后进入一个循环，在每次循环中调用select.select()方法，该方法接受三个列表参数：potential_readers（可能需要读取数据的套接字列表）、potential_writers（可能需要写入数据的套接字列表）、potential_errs（需要检查错误的套接字列表，通常为空），以及一个可选的超时时间参数。select.select()方法会阻塞直到有套接字准备好进行读、写或发生错误，返回的三个列表分别包含实际可读、可写和有错误的套接字。如果服务端套接字在可读列表中，表示有新的客户端连接请求，接受连接并将新的客户端套接字设置为非阻塞模式后添加到potential_readers列表中；如果是客户端套接字在可读列表中，则接收数据并进行处理；对于可写列表中的套接字，可以尝试发送数据；对于有错误的套接字，则从相应列表中移除并关闭。

需要注意的是，在 Unix 系统上，select适用于套接字和文件；而在 Windows 系统上，select仅适用于套接字。此外，在 C 语言中，许多更高级的套接字选项在 Windows 上的执行方式与 Unix 不同，在 Windows 平台使用套接字时，多线程方式更为常见。

总结

本文全面介绍了 Python 套接字编程的核心知识，从套接字的基本概念、创建过程，到进程间通信、数据传输处理、连接管理，再到非阻塞套接字和select库的使用，涵盖了套接字编程的各个关键环节。通过深入学习这些内容，读者能够掌握在不同网络场景下使用 Python 进行套接字编程的技能，开发出高效、稳定的网络应用程序。在实际应用中，应根据具体需求选择合适的套接字类型、通信方式和数据处理策略，并注意跨平台兼容性和资源管理等问题。

TAG：Python；套接字编程；网络通信；TCP；非阻塞套接字；select 库

云南网站建设,企业信息化软件定制开发

公告