【linux】系统编程-8-Socket


前言

11. 套接字

  • 前面介绍的管道、信号量、消息队列共享内存等等都是用于单个计算机的进程间通信
  • 基于套接字的进程间通信机制,可实现跨主机的进程间通信

11.1 Socket简介

  • 套接字(socket)是一种通信机制,凭借这种机制, 客户端<->服务器 模型的通信方式既可以在本地设备上进行,也可以跨网络进行。
  • 套接字机制可实现 多客户端到一个服务器
  • 在Socket中,它使用一个套接字来记录网络的一个连接,套接字是一个整数。
  • 在网络中,可以对socket进行网络连接、读取数据、发送数据和终止连接等操作。
  • 相关头文件
#include <sys/types.h>
#include <sys/socket.h>
  • 套接字本身只是用户程序与内核交互信息的枢纽,没有网络协议地址和端口号等信息,所以在使用时需要用bind()绑定一下
  • 概念上注意套接字与端口号的区别。套接字可以理解为IP+端口号
  • 个人辅助理解:一个端口号对应一个应用程序,一个应用程序内,理论上可以多个套接字绑定一个端口号,但是大多数系统不允许这么干。 肚脐
  • 一个服务器一般只创建一个监听套接字,它在该服务器的生命周期内是一直存在的。同时,服务器也会为每个已连接的客户端创建一个已连接套接字在accept()连接成功后,内核会自动生成一个全新的套接字)。

11.2 socket()

  • socket()函数用于创建一个socket描述符,用于标识唯一一个socket。
  • 函数原型:int socket(int domain, int type, int protocol);
    • domain:表示该套接字使用的协议族(对于TCP/IP,一般选择AF_INET就可以了
      • AF_UNIX, AF_LOCAL: 本地通信
      • AF_INET : IPv4
      • AF_INET6 : IPv6
      • AF_IPX : IPX - Novell 协议
      • AF_NETLINK : 内核用户界面设备
      • AF_X25 : ITU-T X.25 / ISO-8208 协议
      • AF_AX25 : 业余无线电 AX.25 协议
      • AF_ATMPVC : 访问原始ATM PVC
      • AF_APPLETALK : AppleTalk
      • AF_PACKET : 底层数据包接口
      • AF_ALG : 内核加密API的AF_ALG接口
    • type:服务类型
      • SOCK_STREAM:提供可靠的(即能保证数据正确传送到对方)面向连接的Socket服务,多用于资料(如文件)传输,如TCP协议。
      • SOCK_DGRAM:是提供无保障的面向消息的Socket 服务,主要用于在网络上发广播信息,如UDP协议,提供无连接不可靠的数据报交付服务。
      • SOCK_SEQPACKET:为固定最大长度的数据报提供有序的,可靠的,基于双向连接的数据传输路径。
      • SOCK_RAW:表示原始套接字,它允许应用程序访问网络层的原始数据包,这个套接字用得比较少,暂时可忽略。
      • SOCK_RDM:提供不保证排序的可靠数据报层。
    • protocol:套接字使用的协议。当protocol为0时,会自动选择type类型对应的默认协议。
      • 如:当在IPv4,只有TCP协议提供SOCK_STREAM这种可靠的服务,此时,protocol为0即可。
    • 返回
      • 成功:返回一个大于 0 的套接字描述符
      • 失败:返回-1

11.3 bind()

  • bind()函数用于将一个 IP 地址或端口号与一个套接字进行绑定,许多时候内核会帮我们自动绑定一个IP地址与端口号,但是也可以手动绑定。
  • 函数原型:int bind(int sockfd, struct sockaddr *my_addr, socklen_t addrlen);
    • sockfd:sockfd是由socket()函数返回的套接字描述符。
    • my_addr:my_addr是一个指向套接字地址结构的指针。
    • addrlen:addrlen指定了以addr所指向的地址结构体的字节长度。
    • 返回:
      • 成功:返回 0
      • 失败:返回-1
  • sockaddr结构体:
struct sockaddr {
    sa_family_t     sa_family;
    char             sa_data[14]; // 填入IP、端口号等信息
    };
  • 一般不使用 sockaddr 结构体,因为操作不方便,而是使用 sockaddr_in。因为两者占用相同的空间。可以代替。(赋参数时进行强制类型转换即可)
  • sockaddr_in结构体:
struct sockaddr_in {
    short int sin_family;               /* 协议族 */
    unsigned short int sin_port;        /* 端口号 */
    struct in_addr sin_addr;            /* IP地址 */
    unsigned char sin_zero[8];          /* sin_zero是为了让sockaddr与sockaddr_in两个数据结构保持大小相同而保留的空字节 */
    };

11.4 connect()

  • connect()函数用于客户端,将socket与远端的IP地址、端口号绑定。如在TCP客户端中调用该函数,将会发生握手过程。
  • 函数原型:int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
    • 参数参考 bind() 函数
    • 返回:
      • 成功:返回0
      • 失败:返回-1,错误存在于errno中

11.5 listen()

  • listen()函数用于服务器端,使服务器端进入监听状态,等待客户端请求连接。
  • 函数原型:int listen(int sockfd, int backlog);
    • sockfd:sockfd是套接字描述符。
    • backlog:表示sockfd的等待连接队列能够达到的最大值。
      • 当多个客户端同时尝试连接本服务器时,内核会在自己的进程空间中维护一个队列来保存这些请求,当队列满时,后面进来的请求,服务器端会将其丢弃,客户端会收到连接失败的错误。

11.6 accept()

  • accept()函数用于服务器端,主要是处理来自客户端的连接请求。
  • 函数原型:int accept(int s, struct sockaddr *addr, socklen_t *addrlen);
    • 参数参考 bind() 函数
    • 返回:
      • 成功:如果连接成功,会建立一个和参数sockfd相同属性的连接套接字,并为该连接套接字分配一个文件描述符。最终返回一个socket描述符(非负值)。
      • 失败:返回-1
  • 当套接字标记为阻塞模式,队列中没有未完成处理的连接请求时,调用 accept() 函数会一直阻塞,直至与远端建立连接。
  • 当套接字标记为非阻塞模式,队列中没有未完成处理的连接请求时,调用 accept() 函数会立即返回EAGAIN。

11.7 read()

  • 当客户端与服务器端建立好TCP连接之后,我们就可以通过sockfd套接字描述符(已连接套接字描述符,由sccept()产生)来收发数据。
  • 接收网络中的数据可以使用read()、recv()、recvfrom()等。
  • 函数原型:ssize_t read(int fd, void *buf, size_t count);
    • fd:可以是文件描述符,也可以是套接字描述符。在本章节中为套接字描述符。
    • buf:接收数据的缓冲区。
    • count:需要读取的字节数。
    • 返回:
      • 成功:实际读取到的字节数。(情况一:文件剩余字节数小于count,则返回的字节数是小于count的)
      • 失败:返回-1,错误存在于errno中:
        • EINTR:在读取到数据前被信号所中断。
        • EAGAIN:使用 O_NONBLOCK 标志指定了非阻塞式输入输出,但当前没有数据可读。
        • EIO:输入输出错误,可能是正处于后台进程组进程试图读取其控制终端,但读操作无效,或者被信号SIGTTIN所阻塞, 或者其进程组是孤儿进程组,也可能执行的是读磁盘或者磁带机这样的底层输入输出错误。
        • EISDIR:fd 指向一个目录。
        • EBADF:fd 不是一个合法的套接字描述符,或者不是为读操作而打开。
        • EINVAL:fd 所连接的对象不可读。
        • EFAULT:buf 超出用户可访问的地址空间。

11.8 recv()

  • recv()函数功能和read()函数功能差不多,客户端和服务器端都可以使用该函数来接收另一端的数据。
  • recv()实际上是拷贝数据,接收数据是由协议完成的。recv()函数会先检查套接字的接收缓冲区,若缓冲区中没有数据或正在接收数据,recv()函数会一直等待,直至协议接收数据完毕,recv()才能把缓冲区的数据读走。
  • 函数原型:ssize_t recv(int sockfd, void *buf, size_t len, int flags);
    • sockfd:指定接收端套接字描述符。
    • buf:指定一个接收数据的缓冲区,该缓冲区用来存放recv()函数接收到的数据。
    • len:指定recv()函数拷贝的数据长度。
    • flags
      • 0:一般置为0即可
      • MSG_OOB:接收以out-of-band送出的数据。
      • MSG_PEEK:保持原有数据,就是说接收到的数据在缓冲区中并不会被删除, 如果再调用recv()函数还会拷贝相同的数据到buf中。
      • MSG_WAITALL:强迫接收到指定len大小的数据后才能返回, 除非有错误或信号产生。
      • MSG_NOSIGNAL:recv()函数不会被SIGPIPE信号中断。
    • 返回:
      • 成功:实际读取到的字节数。
      • 失败:返回-1,错误存在于errno中:
        • EBADF:fd 不是一个合法的套接字描述符,或者不是为读操作而打开。
        • EFAULT:buf 超出用户可访问的地址空间。
        • ENOTSOCK:参数 s 为一文件描述词, 非socket。
        • EINTR:在读取到数据前被信号所中断。
        • EAGAIN:此动作会令进程阻塞, 但参数s的 socket 为不可阻塞。
        • ENOBUFS:buf内存空间不足。
        • ENOMEM:内存不足。
        • EINVAL:传入的参数不正确。

11.9 write()

  • write()函数一般用于处于稳定的TCP连接中传输数据。UDP协议也可以使用。
  • write()函数在写入数据完成后并不是立即发送的,至于什么时候发送则由TCP/IP协议栈决定。
  • 函数原型:ssize_t write(int fd, void *buf, size_t count);
    • fd:可以是文件描述符,也可以是套接字描述符。在本章节中为套接字描述符。
    • buf:发送数据的缓冲区。
    • count:需要发送字节数。
    • 返回:
      • 成功:返回实际写入的字节数
      • 失败:返回-1,错误存在于errno
  • 注意,网络编程中write()是不负责将全部数据写完之后再返回的,或许中途就返回了。若想保证数据全部写入,必须循环运行write()函数,可自行封装。代码如下:(copy野火
/* Write "n" bytes to a descriptor. */
ssize_t writen(int fd, const void *vptr, size_t n)
{
    size_t      nleft;      //剩余要写的字节数
    ssize_t     nwritten;   //已经写的字节数
    const char  *ptr;       //write的缓冲区

    ptr = vptr;             //把传参进来的write要写的缓冲区备份一份
    nleft = n;              //还剩余需要写的字节数初始化为总共需要写的字节数

    //检查传参进来的需要写的字节数的有效性
    while (nleft > 0) {
        if ( (nwritten = write(fd, ptr, nleft)) <= 0) { //把ptr写入fd
            if (nwritten < 0 && errno == EINTR) //当write返回值小于0且因为是被信号打断
                nwritten = 0;       /* and call write() again */
            else
                return(-1);         /* error 其他小于0的情况为错误*/
        }

        nleft -= nwritten;          //还剩余需要写的字节数=现在还剩余需要写的字节数-这次已经写的字节数
        ptr += nwritten;          //下次开始写的缓冲区位置=缓冲区现在的位置右移已经写了的字节数大小
    }
    return(n); //返回已经写了的字节数
}

11.10 send()

  • 无论是客户端还是服务器应用程序都可以用write()函数来向TCP连接的另一端发送数据。
  • 当使用send()发送数据时,send()会先比较需要发送的长度len和套接字sockfd的发送缓冲区长度,若len大,则返回SOCKET_ERROR。若len小于等于,send()函数会先检查协议是否正在发送套接字sockfd的发送缓冲区的数据,如果是,就等待发送完毕,如果还没有开始发送,则send()函数会继续比较len和发送缓冲区中剩余空间长度,若len大,则等待发送缓冲区发送完毕,若len小于等于,则把数据copy到发送缓冲区。
  • copy成功后,send()函数就马上返回,但是不一定马上发送,什么时候发送取决于TCP/IP协议。
  • 函数原型:int send(int sockfd, const void *msg, size_t len, int flags);
    • sockfd:指定发送端套接字描述符。
    • msg:指定要发送数据的缓冲区。
    • len:指定recv()函数拷贝的数据长度。
    • flags:一般为0即可。
    • 返回:
      • 成功:返回实际copy的字节数
      • 失败:返回SOCKET_ERROR

11.11 sendto()

  • sendto()函数与send()函数相似,但是它会通过 struct sockaddr 指向的 to 结构体指定要发送给哪个远端主机,在to参数中需要指定远端主机的IP地址、端口号等,而tolen参数则是指定to 结构体的字节长度。
  • sendto()适用于已连接的数据报或流式套接口发送数据。
  • 函数原型:int sendto(int s, const void *msg, size_t len, int flags, const struct sockaddr *to, socklen_t tolen);
    • s:一个标识套接口的描述字。
    • buf:包含待发送数据的缓冲区。
    • len:buf缓冲区中数据的长度。
    • flags:调用方式标志位。
    • to:(可选)指针,指向目的套接口的地址。
    • tolen:to所指地址的长度。

11.12 close()

  • close()函数是用于关闭一个指定的套接字。
  • 函数原型:int close(int fd);

11.13 ioctlsocket()

  • ioctlsocket()函数用于获取与设置套接字相关的操作参数。
  • 函数原型int ioctlsocket( int s, long cmd, u_long *argp);
    • s:指定要操作的套接字描述符。
    • cmd:对套接字s的操作命令。
      • FIONBIO:允许或禁止套接口s的非阻塞模式。
      • FIONREAD:确定套接口s自动读入的数据量。argp指向一个无符号长整型,其中存有ioctlsocket()的返回值。
      • SIOCATMARK:确实是否所有的带外数据都已被读入。
    • argp:指向cmd命令所带参数的指针。argp指向一个无符号长整型。如允许非阻塞模式则非零,如禁止非阻塞模式则为零。
    • 返回:
      • 成功:ioctlsocket()返回0。
      • 失败:返回SOCKET_ERROR错误,应用程序可通过WSAGetLastError()获取相应错误代码:
        • WSANOTINITIALISED:在使用此API之前应首先成功地调用WSAStartup()。   
        • WSAENETDOWN:WINDOWS套接口实现检测到网络子系统失效。   
        • WSAEINVAL:cmd为非法命令,或者argp所指参数不适用于该cmd命令,或者该命令不适用于此种类型的套接口。
        • WSAEINPROGRESS:一个阻塞的WINDOWS套接口调用正在运行中。   
        • WSAENOTSOCK:描述字不是一个套接口。

11.14 getsockopt()、setsockopt()

  • getsockopt()、setsockopt()分别是获取和设置套接字。
  • 函数原型:
    • int getsockopt(int sockfd, int level, int optname, void *optval, socklen_t *optlen);
    • int setsockopt(int sockfd, int level, int optname,const void *optval, socklen_t optlen);
      • sockfd:指定要操作的套接字描述符。
      • level
        • SOL_SOCKET:表示在Socket层。
        • IPPROTO_TCP:表示在TCP层。
        • IPPROTO_IP: 表示在IP层。
      • optname:该层的具体选项,如:
        • 对于SOL_SOCKET选项
          • SO_REUSEADDR(允许重用本地地址和端口)
          • SO_SNDTIMEO(设置发送数据超时时间)
          • SO_SNDTIMEO(设置接收数据超时时间)
          • SO_RCVBUF(设置发送数据缓冲区大小)等等。
        • 对于IPPROTO_TCP选项
          • TCP_NODELAY(不使用Nagle算法)
          • TCP_KEEPALIVE(设置TCP保活时间)等等。
        • 对于IPPROTO_IP选项
          • IP_TTL(设置生存时间)
          • IP_TOS(设置服务类型)等等。

参考:

* 野火
posted @ 2021-01-21 19:15  李柱明  阅读(153)  评论(0编辑  收藏  举报