系统调用 | select | poll | epoll |
函数原型 | int select(int nfds, fd_set* readfds, fd_set* writefds, fd_set* exceptfds, struct timeval* timeout) | int poll(struct pollfd* fds, nfds_t nfds, int timeout) |
int epoll_create(int size) int epoll_ctl(int epfd, int op, int fd, struct epoll_event* event) int epoll_wait(int epfd, struct epoll_event* events, int maxevents, int timeout) |
事件集合 | 用户通过3个参数分别传入感兴趣的可读、可写以及异常等事件,内核通过对这些参数的在线修改来反馈其中的就绪事件。这使得用户每次调用select都要重置这3个参数参数 | 统一处理所有事件类型,因此只需一个事件集参数。用户通过pollfd.events传入感兴趣的事件,内核通过修改pollfd.revents反馈其中就绪的事件 | 内核通过一个事件表直接管理用户感兴趣的所有事件。因此每次调用epoll_wait时,无须反复传入用户感兴趣的事件。epoll_wait系统调用的参数events仅用来反馈就绪的事件 |
应用程序索引就绪文件描述符的事件复杂度 | O(n) | O(n) | O(1) |
最大文件描述符数 | 一般有最大值限制(由FD_SETSIZE指定) | 系统允许打开的最大文件描述符数目 | 系统允许打开的最大文件描述符数目 |
工作模式 | Level Trigger | Level Trigger | Level/Edge Trigger |
内核实现和工作效率 | 采用轮询方式来检测就绪事件,算法时间复杂度为O(n) | 采用轮询方式来检测就绪事件,算法时间复杂度为O(n) |
采用回调方式来检测就绪事件,算法时间复杂度为O(1)。无论是select,poll还是epoll都需要内核把FD消息通知给用户空间,如何避免不必要的内存拷贝就很重要,在这点上,epoll是通过内核与用户空间mmap同一块内存实现的。 epoll因为采用mmap的机制, 使得内核socket buffer和用户空间的buffer共享, 从而省去了socket data copy, 这也意味着, 当epoll回调上层的callback函数来处socket 数据时, 数据已经从内核层 "自动" 到了用户空间, 虽然和用poll 一样, 用户层的代码还必须要调用 read/write, 但这个函数内部实现所触发的深度不同了. |
使用差别 |
fd_set read_fds; FD_ZERO(&read_fds); while(1){ FD_SET(connfd, &read_fds); ret = select(connfd + 1, &read_fds, NULL, NULL, NULL); if(FD_ISSET(connfd, &read_fds)){ //事件处理 } }
|
int ret = poll(fds, MAX_EVENT_NUMBER, -1); for(int i = 0; i < MAX_EVENT_NUMBER; ++i){ if(fds[i].revents &POLLIN){ int sockfd = fds[i].fd; //事件处理 } }
|
int ret = epoll_wait(epollfd, events, MAX_EVENT_NUMBER, -1); for(int i = 0; i < ret; i++){ int sockfd = events[i].data.fd; //事件处理 }
|