select和epoll的实现

select：fd_set是输入结果参数，每次select之后，还得重置fd_set

（1）使用copy_from_user从用户空间拷贝fd_set到内核空间，第一步需要复制所有感兴趣的文件描述符到内核态

（2）注册回调函数__pollwait

（3）遍历所有fd，调用其对应的poll方法（对于socket，这个poll方法是sock_poll，sock_poll根据情况会调用到tcp_poll,udp_poll或者datagram_poll）

（4）以tcp_poll为例，其核心实现就是__pollwait，也就是上面注册的回调函数。

（5）__pollwait的主要工作就是把current（当前进程）挂到设备的等待队列中，不同的设备有不同的等待队列，对于tcp_poll来说，其等待队列是sk->sk_sleep（注意把进程挂到等待队列中并不代表进程已经睡眠了）。在设备收到一条消息（网络设备）或填写完文件数据（磁盘设备）后，会唤醒设备等待队列上睡眠的进程，这时current便被唤醒了。（设备可以用fd表示，设备是通过fd和进程相关联的）

（6）poll方法返回时会返回一个描述读写操作是否就绪的mask掩码，根据这个mask掩码给fd_set赋值。

（7）如果遍历完所有的fd，还没有返回一个可读写的mask掩码，则会调用schedule_timeout是调用select的进程（也就是current）进入睡眠。当设备驱动发生自身资源可读写后，会唤醒其等待队列上睡眠的进程，然后继续循环遍历fd。如果超过一定的超时时间（schedule_timeout指定），还是没人唤醒，则调用select的进程会重新被唤醒获得CPU，进而重新遍历fd，判断有没有就绪的fd。

（8）把fd_set从内核空间拷贝到用户空间。

性能瓶颈：

（1)数千个设备fd在每次调用时，都需要将其从用户空间复制到内核空间，这里的开销不可忽略,从内核态到用户态的拷贝，也不可忽略

（2）同时每次调用select都需要在内核遍历传递进来的所有fd，对于每个fd都得调用poll方法，这个开销在fd很多时也很大

循环调用poll方法，也就是循环把current进程挂到设备中，目的是设备fd就绪的时候，能够唤醒进程。

epoll：

所有添加到epoll中的事件都会与设备(网卡)驱动程序建立回调关系，也就是说，当相应的事件发生时会调用这个回调方法。这个回调方法在内核中叫ep_poll_callback,它会将发生的事件添加到rdlist双链表中。

epoll的解决方案不像select或poll一样每次都把current轮流加入fd对应的设备等待队列中，而只在epoll_ctl时把current挂一遍（这一遍必不可少）并为每个fd指定一个回调函数，当设备就绪，唤醒等待队列上的等待者时，就会调用这个回调函数，而这个回调函数会把就绪的fd加入一个就绪链表）。epoll_wait的工作实际上就是在这个就绪链表中查看有没有就绪的fd（利用schedule_timeout()实现睡一会，判断一会的效果，和select实现中的第7步是类似的）

epoll:只是在epoll_ctl的时候，把current进程挂到fd设备的等待队列中，而且设置fd对应的回调函数，当fd就绪的时候，唤醒进程，然后将fd加入rdlist链表中。这样在一次epoll中，就只需要挂在设备中一次。而select中，在fd就绪的时候，重新遍历fd的时候，还得调用poll方法，此方法把current（当前进程）挂到设备的等待队列中。

posted @ 2015-07-25 20:12 kkshaq 阅读(464) 评论(0) 收藏举报

刷新页面返回顶部

select和epoll的实现

公告