【HTTP请求】、详解

一、协议介绍

  HTTP(HyperText Transfer Protocol,超文本传输协议)是一套计算机通过网络进行通信的规则,使HTTP客户端能够从HTTP服务器端请求到信息和服务,目前的版本号是1.1 是无状态协议,无状态是指从客户端发送HTTP请求到服务器,服务器接收到请求之后做出回应,这样链接就关闭了,在服务器端不需要保留客户端的相关信息。

二、协议过程

  HTTP通讯机制是在一次完整的HTTP通讯过程中,客户端和服务器之间建立连接分为以下几个步骤。

  1. 建立连接: 其中包括:域名解析,TCP三次握手。

    域名解析:将HTTP请求中的域名转化为IP地址,其中主要步骤有,以Chrome为例,访问www.baidu.com

    ① 首先,Chrome会搜索浏览器自身的DNS缓存(缓存较少),看自身有没有改域名的IP地址,如果有停止解析返回IP,如果没有继续解析。

      注解:Chrome中的DNS可以通过在浏览器中输入 chrome://net-internals/#dns 来进行查看浏览器DNS缓存。

     

 

    ② 如果在浏览器的自身的DNS缓存中没有找到,那么Chrome会搜索操作系统自身的DNS缓存,如果找到就停止,没有找到继续解析。

    注解:可以通过命令行  ipconfig /displaydns 来查看操作系统的DNS缓存。

      

    ③ 如果chrome在操作系统的DNS缓存中没有找到,那么会尝试读取host(C:\Windows\System32\drivers\etc)文件,看看这里面有没有对应的DNS地址

    

    ④ 如果host文件中没有找到,那么chrome会发送一个DNS系统调用, 会首先向默认的DNS服务器发送域名解析(一般默认的是网络运营商的,通过UDP协议向DNS的53端口发送请求),如果网络运营商有该域名缓存,那么返回IP,如果没有,该运营商的DNS会发起一个迭代DNS解析请求,首先找到根域名的IP地址,即com域的IP地址。运营商会继续想com域发送域名解析请求,获得baidu.com域的IP地址,进而获得需要解析域名的IP地址(如果www.baidu.com 这么难访问,那么就离退休不远了)。

 

    TCP三次握手:拿到域名的IP之后,client会以一个随机端口向web服务器指定端口(默认为80端口,有时候也有用8080端口的)发送TCP链接请求。

    

    

  2. 发送数据:

    client与server建立连接之后,client向server端发送数据包其中数据包中包含以下信息

    ⑴ 请求方法 URI协议/版本

    ⑵ 请求头(Request Header)

    ⑶ 请求正文

    eg.

    

GET/index.jspHTTP/1.1
Accept:image/gif.image/jpeg,*/*
Accept-Language:zh-cn
Connection:Keep-Alive
Host:localhost
User-Agent:Mozila/4.0(compatible;MSIE5.01;Window NT5.0)
Accept-Encoding:gzip,deflate
 
username=jinqiao&password=1234

 

    ⑴ 请求方法 URI协议/版本

    请求的第一行 GET/index.jsp HTTP/1.1 

    “GET” 代表请求方法,“/index.jsp”代表URI协议,“HTTP/1.1”代表协议和协议版本,其中HTTP1.1 支持了七种方法,GET,POST,HEAD,PUT,DELETE,TRACE,CONNECT,OPTIONS. 下面主要说一下GET与POST方法。

    GET:默认的HTTP请求数据,只是对需要提交的信息进行了简单的编码,并将信息附加在URL地址之后 eg. Http://localhost/login.php?username=aa&password=1234 这样会产生将用户的信息暴露的危险。并且浏览器会对URL的长度进行限制,所以提交的信息也有限制。

    POST:主要作用是向web提交表单信息,克服了GET的不安全和数据长度限制的缺点,在发送数据时POST不会将数据附加在URL之后,相对GET方法安全(推荐使用POST方法)。

    ⑵ 请求头 

    请求第二行之后就是请求头,其中包含了客户端环境的相关信息,包含:浏览器所用语言,请求正文长度等。

    ⑶ 请求正文

    请求头结束之后有一个空行(空行表示请求头结束,请求正文开始)

 

  3. 返回数据:

    server端接收到client端的请求之后,开始响应client端,返回数据包。其中数据包包含如下信息

    ⑴ 协议状态版本代码描述

    ⑵ 响应头

    ⑶ 响应正文

    eg. 

    

 1 HTTP/1.1 200 OK
 2 Server:Apache Tomcat/5.0.12
 3 Date:Mon,6Oct2003 13:23:42 GMT
 4 Content-Length:112
 5  
 6 <html>
 7 <head>
 8 ...
 9 </body>
10 </html>

    ⑴  协议状态版本代码描述

    响应的第一行 “HTTP/1.1” 是协议版本, 200 OK 表示响应成功

    HTTP应答码也成状态码,反映了本次HTTP请求的状态,其中主要分为以下几种

    1XX -信息类,表示收到了请求进一步处理中

    2XX -成功类,表示用户的请求被正确接收正,理解,处理。例如200 OK

    3XX -重定向类,表示用户请求没有成功,客户端需要采取进一步动作

    4XX -客户端错误,表示客户端请求错误,其中404 NOT FOUNT 表示资源没有找到

    5XX -服务器端错误,表示服务器不能完成相对于的错误,一般是服务器内部错误。

    ⑵ 响应头

    与请求的类似

    ⑶ 响应正文

    响应头结束之后有一个空行,表示响应头结束,响应正文开始。

 

  4. 关闭连接:

    通过TCP四次握手断开连接。

    TCP 四次握手过程

    TCP是一个全双工的连接, 所以断开的时候需要两个方向分开断开, 原则:一个方向没有数据流动时候发送FIN包断开这个方向的连接。 

    关闭原则 : 先关闭写通道,后关闭读通道 

    【1】 客户端发送FIN来断开 客户端C和服务器方向的连接(关闭客户端向服务器的写通道)

    【2】 服务器端确认断开连接 向客户端发送确认消息(关闭客户端向服务器的读通道) 

    【3】 服务器端发送FIN来断开 服务器和客户端方向的连接(关闭服务器的向写通道) 

    【4】 客户端确认断开连接,向服务器端确认(关闭服务器向客户端的读通道) 

 

    

    CLOSE_WAIT:

    TCP的Close状态出现在被动关闭方(不一定是服务器),出现的时间在接收到主动关闭方的FIN而自身未发送 ACK, 如果出现大量的 close-wait需要检查服务器代码.

 

    TIME_WAIT:

    TCP关闭的主动方在接受到FIN之后再等待2MSL(windows大概240S)后再关闭 
    原因 
    【1】防止IP通信不稳定,如果直接Close, 如果服务器没有接收到客户端的Close-Wait,再次向客户端发送FIN, 此时客户端已经关闭,则返回的是RST,服务端会把这个错误交到高层。 

    【2】防止原来的数据影响下次通讯, 如果主动方直接Close, 并且向服务器重新发送另外一个请求,虽然说端口不一定相同, 但是如果相同的话,原来的socket中滞留的数据,在建立连接之后发送到服

    务端,这样会造成数据混肴,所以TCP要等待 2MSL之后关闭连接。

    经过千锤百炼出来的各种协议,每一处设计都有它的巧妙的体现!!!!!!!!!!!!

 

posted @ 2017-07-06 17:04  三生石1314  阅读(1925)  评论(0编辑  收藏  举报