HTTP 长连接

上周再做一个easyproxy的小项目,实现代码反向代理的工作,具体就是在tcp层对各个请求(只要遵循建立在tcp层之上的协议即可)进行解析,然后分发各个具体服务上。

这中间遇到的一个问题就是HTTP中的长连接问题,重新去看了下具体的http协议,发现之前对这块知识还是存在盲点。

这篇文章可以算是自己的学习笔记, 很多内容更是直接使用我看到和觉得讲得不错的资料,希望对大家也有所帮助。

基础知识

 1. 名称

 维基百科中的介绍:

“HTTP persistent connection, also called HTTP keep-alive, or HTTP connection reuse, is the idea of using a single TCP connection to send and receive multiple HTTP requests/responses, as opposed to opening a new connection for every single request/response pair.”

讲这个,是因为我觉得“长连接”这个称呼并不是非常准确,用“持久连接”,而“Long Connection”这种直接翻译词就更不用再用了。但毕竟这个名字已经沿用这么久了,我们也就继续用这个名

2. 原理

在HTTP协议中长连接中同一个TCP连接来发送和接收多个HTTP请求/应答,而不是为每一个新的请求/应答打开新的连接的方法。

下图是网上一张很形象讲解普通连接和长连接区别的图

从图中,我们就能清晰地看到,两者区别就是长连接会“复用”原先建立TCP连接

3. 实现

在 HTTP 1.0 中

没有官方的 keepalive 的操作。通常是在现有协议上添加一个指数。如果浏览器支持 keep-alive,它会在请求的包头中添加:

Connection: Keep-Alive

然后当服务器收到请求,作出回应的时候,它也添加一个头在响应中:

Connection: Keep-Alive

这样做,连接就不会中断,而是保持连接。当客户端发送另一个请求时,它会使用同一个连接。这一直继续到客户端或服务器端认为会话已经结束,其中一方中断连接。

比如我用chrome访问博客园首页

request header:

 

response header:

在 HTTP 1.1 中 

所有的连接默认都是持续连接,除非特殊声明不支持。

所以现在各个浏览器的高版本基本都是支持长连接。

 

4. 优势

  • 较少的CPU和内存的使用(由于同时打开的连接的减少了)
  • 允许请求和应答的HTTP pipelining
  • 降低网络阻塞 (TCP连接减少了)
  • 减少了后续请求的延迟(无需再进行握手)
  • 报告错误无需关闭TCP连接

 其实它一切的优势就在于复用了原先建立的TCP连接,减少重新建立TCP连接的消耗

5. 劣势

  • 空闲的连接需要过段时间后才能被断开,可能影响整体性能(比如那些单次访问次数多的web 服务)

 

6. 浏览器 

 现在的高版本浏览器都是默认支持长连接的,而它们维护长连接的方式就是用“超时管理”。

 在一段时间内没有请求和相应时,就自动将连接断掉。

 

 

参考文章:

维基百科介绍:英文

Persistent HTTP Connections in RFC 2616 "Hypertext Transfer Protocol -- HTTP/1.1

posted @ 2013-05-12 21:42  lengyuhong  阅读(7417)  评论(4编辑  收藏  举报