socket编程 - 详解

正确理解端口号

理解源IP地址和目的IP地址

IP地址可以在网络中唯一标识一台主机,这也就意味着,只要我知道你的IP地址,就能向你的主机发送数据。但是这有一个问题, 主机接收到数据之后发送给哪个进程?此时出现了端口。端口是主机标识进程的一个16位的整数。拿着IP地址和端口号,我们就能在网络中定位到唯一的主机上的唯一的进程。更为准确的,网络通信本质还是进程间通信,只不过这两个进程可能不在一台主机上。
在这里插入图片描述

认识端口号

端口是传输层协议的内容

  • 端口号是一个2字节16位的整数
  • 端口号用来表示一个进程,告诉操作系统,当前这个数据要交给哪个进程来处理
  • IP地址+端口能够表示网络中某一台主机的某一个进程
  • 一个端口只能被一个进程占用,一个进程可以占用多个端口
    在这里插入图片描述
端口范围划分
  • 0 - 1023:知名端口,HTTP、FTP、SSH等这些广为使用的应用层协议,它们的端口都是固定的
  • 1024-65535:操作系统动态分配的端口号。客户端程序的端口号,就是由操作系统从这个范围分配的。

端口号和进程ID(PID)

前面提到端口号是为了唯一标识一台主机的某个进程,那么为什么不适用PID呢?

  • PID标识的是正在运行中的进程,一旦程序退出,这个进程就找不到了
  • PID是变化的,可能每次运行程序得到的PID都不一样
  • 而且进程ID属于操作系统层面,由操作系统控制,端口号处于网络层面,如果端口号和进程PID绑定,会让系统进程管理和网络强耦合。

理解socket

  • IP地址用来表示唯一主机,port用来标记主机上唯一的网络进程
  • 所以,通信的时候,本质是两个互联网进程代表人来进行通信,{srcIp,srcPort,dstIp,dstPort}这样的4 元组就能标识互联网中唯二的两个进程
  • 所以网络通信的本质,就是进程间通信
  • ip+port叫做套接字socket

网络字节序

我们知道,数据在内存中的存储方式有大小端之分,磁盘文件中的多字节数据相对于文件中的偏移地址也有大小端之分,网络数据流也有大小端之分。如果传输数据双方的主机一个是大端存储,一个是小端存储,假设我们不做任何处理就将数据发送能够给对方,那对方拿到的数据就会出现乱码。
TCP/IP 协议规定,网络数据流应采用大端字节序,即低地址高字节,所以如果当前发送主机是小端, 就需要先将数据转成大端; 否则就忽略, 直接发送即可。
在这里插入图片描述

  • htonl函数的作用是将 32 位的长整数从主机字节序转换为网络字节序,例如将 IP 地址转换后准备发送
  • htons函数的作用是将 16 位的短整数从主机字节序转换为网络字节序,例如将 端口号 地址转换后准备发送
  • ntohl函数的作用是将 32 位的长整数从网络字节序转换为主机字节序,例如将 接收到的 IP 地址转换后使用
  • ntohs函数的作用是将 16 位的短整数从网络字节序转换为主机字节序,例如将接收到的端口号转换后使用

socket编程接口

C
// 创建 socket 文件描述符 (TCP/UDP, 客户端 + 服务器)
int socket(int domain, int type, int protocol);
// 绑定端口号 (TCP/UDP, 服务器)
int bind(int socket, const struct sockaddr *address,socklen_t address_len);
// 开始监听 socket (TCP, 服务器)
int listen(int socket, int backlog);
// 接收请求 (TCP, 服务器)
int accept(int socket, struct sockaddr* address,socklen_t* address_len);
// 建立连接 (TCP, 客户端)
int connect(int sockfd, const struct sockaddr *addr,socklen_t addrlen);

一般来说,使用socket编程需要包含四个头文件

#include <sys/types.h>
  #include <sys/socket.h>
    #include <arpa/inet.h>
      #include <netinet/in.h>
创建socket套接字
// 创建一个IPv4的TCP套接字
int socket(int domain, int type, int protocol);
  • domain:地址簇,常见的有AF_INET(IPv4),和AF_INET6(IPv6)
  • type:套接字类型,常见的有SOCK_STREAM(TCP)SOCK_DGRAM(UDP)
  • protocol:协议,通常为0(自动选择),也可以指定协议,如IPPROTO_TCPIPPROTO_UDP
  • 成功时返回一个套接字描述符,失败时返回-1,并设置error
    也就是说,调用socket这个函数跌倒一个文件描述符,在操作系统的内核中,它对应一个数据结构,存储了该套接字的各种状态信息和资源,例如IP地址、端口号、通信协议、缓冲区等
bind绑定套接字

bind函数将套接字绑定到一个IP地址和端口号。

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
  • sockfd:套接字描述符
  • addr:指向sockaddr结构体的指针,该结构体对象包含了要绑定的地址信息,对于IPv4,使用sockaddr_in 结构体;对于IPv6,使用 sockaddr_in6 结构体。
  • addr_lenaddr指向结构体对象的大小,通常使用sizeof获取
  • 成功时返回0,失败时返回-1并设置errno
listen建立监听

listen函数使套接字进入监听状态,准备接受连接请求。

int listen(int sockfd, int backlog);
  • sockfd:套接字描述符
  • backlog:挂起连接的最大队列长度,即最多有多少个连接可以等待被接受
  • 成功时返回0,失败时返回-1并设置errno
accept接受连接

accept函数接受一个连接请求,返回一个新的套接字描述符,用于与客户端通信

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
  • sockfd:监听套接字描述符,即listen获取的套接字描述符
  • addr指向sockaddr结构体对象的指针,用来存储客户端地址信息
  • sockfd:监听套接字描述符,即listen获取的套接字描述符
  • 成功时返回新的套接字描述符,失败时返回-1并设置errno
connect建立连接

connect函数用于客户端连接到服务器

int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
  • sockfd:套接字描述符
  • addr指向sockaddr 结构体对象的指针,用于存储服务器地址信息
  • addrlen: sockaddr 结构体的大小。
  • 成功时返回0,失败时返回-1并设置errno
sendto发送数据

sendto函数是用于在 无连接套接字**(如UDP)上发送数据 的。它允许程序指定目标地址,从而可以在一个套接字上与多个目标进行通信。

ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,
const struct sockaddr *dest_addr, socklen_t addrlen);
  • sockfd:套接字描述符,通过socket函数创建
  • buf:要发送的缓冲区
  • len:要发送的数据的长度
  • flags:发送标志,通常为0
  • dest_addr:指向sockaddr结构体的指针,包括目的地址和端口号
  • addlen:sockaddr结构器的大小
  • 成功时返回发送的字节数,失败时返回-1,并设置 errno 以指示错误
接收数据

recvfrom 函数用于在无连接的套接字(如UDP)上接收数据,它允许程序获取发送数据的源地址。它常用于UDP服务器接收数据包,并且能够知道数据包的来源。

ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
struct sockaddr *src_addr, socklen_t *addrlen);
  • sockfd: 套接字描述符,通过 socket 函数创建。
  • buf: 指向存储接收数据的缓冲区。
  • len: 缓冲区的长度,即可以接收的最大字节数。
  • flags: 接收标志,通常为0。
  • src_addr: 指向 sockaddr 结构体的指针,用于存储发送方的地址信息。
  • addrlen: 指向 socklen_t 变量的指针,表示 sockaddr 结构体的大小。调用函数时需要设置为 sockaddr 结构体的大小,函数返回时设置为实际地址的长度。
close关闭套接字

跟关闭文件描述符一样,创建的套接字描述符用完之后也需要手动关闭,同样的使用close函数。

int close(int fd);
  • 成功返回0,失败返回-1
sockaddr结构体

在这里插入图片描述

  • sockaddr
struct sockaddr {
sa_family_t sa_family;  // 地址族(Address family)
char sa_data[14];       // 套接字地址数据(Socket address data)
};
  • sockaddr_in:
struct sockaddr_in {
sa_family_t sin_family;   // 地址族(AF_INET)
in_port_t sin_port;       // 端口号(Port number),网络字节序
struct in_addr sin_addr;  // IPv4地址
char sin_zero[8];         // 填充字节,使结构体大小与 `sockaddr` 一致
};
  • in_addr
struct in_addr {
uint32_t s_addr;  // 32位IPv4地址,网络字节序
};

in_addr 用来表示一个 IPv4 的 IP 地址. 其实就是一个 32 位的整数;

posted on 2025-12-06 15:38  ljbguanli  阅读(0)  评论(0)    收藏  举报