HTTP协议

什么是HTTP协议

协议是指计算机通信网络中两台计算机之间进行通信所必须共同遵守的规定或规则,超文本传输协议(HTTP)是一种通信协议,它允许将超文本标记语言(HTML)文档从Web服务器传送到客户端的浏览器

Web服务器,浏览器,代理服务器

用户在浏览器地址栏输入URL后,浏览器给Web服务器发送了一个Request(请求),Web服务器接到Request后进行处理,生成相应的Response(响应),然后发送给浏览器,浏览器解析Response中的HTML,这样用户就看到了网页。

用户的Request有可能是经过了Proxy(代理服务器), 最后才到达Web服务器。

代理服务器就是网络信息的中转站,功能如下:

  1. 提高访问速度,多数代理服务器都有缓存功能。
  2. 突破限制,即FQ。
  3. 隐藏身份。

URL详解

URL(Uniform Resource Locator):统一资源定位符,是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。

 

URL地址用于描述一个网络上的资源, 基本格式如下:

schema: //host[:port#]/path/…/[?query-string][#anchor]

schema                     指定底层使用的协议(例如:http, https, ftp)

host                           HTTP服务器的IP地址或域名

port#                        HTTP服务器的默认端口是80,这种情况下端口号可以省略。

如果使用别的端口,必须指明,例如http://www.baidu.com:8080/

path                          访问资源的路径

query-string             发送给http服务器的数据

anchor-                     锚

 

URL的例子

http://www.mywebsite.com/sj/test/test.aspx?name=sviergn&x=true#stuff

schema                     http

host                           www.mywebsite.com

port#                        HTTP服务器的默认端口是80,这种情况下端口号可以省略。

path                          /sj/test/test.aspx

query-string             name=sviergn&x=true

anchor-                     stuff

HTTP协议是无状态的

对http服务器来说,它并不知道多次的请求是否来自同一个客户端。为解决这个问题,Web程序引入了Cookie机制来维护状态。

打开一个网页需要浏览器发送多次Request

1. 用户在浏览器输入URL后,浏览器发送一个Request去获取URL的HTML。

服务器把Response发送回给浏览器。

2. 浏览器分析Response中的HTML,发现其中引用了很多其他文件,比如图片,CSS文件,JS文件。

浏览器会自动再次发送Request去获取图片,CSS文件,JS文件。

等所有文件都下载成功后,网页就被显示出来了。

HTTP消息的结构

 

Get和Post方法的区别

HTTP协议与服务器交互的方法:GET,POST,PUT,DELETE 。

URL地址用于描述一个网络上的资源,而HTTP中的GET,POST,PUT,DELETE就对应这个资源的查,改,增,删4个操作。

GET一般用于获取/查询资源信息,POST一般用于更新资源信息。

GET和POST区别:

  1. GET     提交的数据放在URL后,以?分割URL和传输数据,参数之间以&连接,如:EditPosts.aspx?name=test1&id=123456。

POST   提交的数据放在HTTP包的Body中。

  1. GET     提交的数据有大小限制(因为浏览器对URL的长度有限制)

POST   提交的数据没有限制

  1. GET     通过Request.QueryString获取变量的值

POST   通过Request.Form获取变量的值

  1. GET     提交数据有安全问题,如登录页面,提交数据时,用户名和密码会出现在URL上,如果页面可以被缓存或者其他人可以访问这台机器,就可以从历史记录获取该用户的账号和密码。

状态码

状态码用来告诉HTTP客户端,HTTP服务器是否产生了预期的Response。

HTTP/1.1(HTTP协议版本号)中定义了五类状态码,状态码由三位数字组成,第一个数字定义了相应的类别

1XX    提示信息             —表示请求已被成功接收,继续处理

2XX    成功                    —表示请求已被成功接收,理解,接受

3XX    重定向                 —要完成请求必须进行更进一步的处理

4XX    客户端错误         —请求有语法错误或请求无法实现

5XX    服务器端错误     —服务器未能实现合法的请求

 

常见状态码

200 OK

      最常见的是成功响应状态码200,这表明该请求被成功地完成,所有请求的资源发送回客户端

302 Found

      重定向,新的URL会在Response中的Location中返回,浏览器将会自动使用新的URL发出新的Request

例如在IE中输入http://www.google.com,服务器会返回302,IE取到Response中Location header的新URL,又重新发送一个Request。

304 Not Modified

      代表上次的文档已经被缓存了, 还可以继续使用

400 Bad Request

      客户端请求与语法错误,不能被服务器所理解

403 Forbidden

      服务器收到请求,但是拒绝提供服务

404 Not Found

      请求资源不存在(输错了URL)

500 Internal Server Error

      服务器发生了不可预期的错误

503 Server Unavailable

      服务器当前不能处理客户端的请求,一段时间后可能恢复正常

HTTP协议是无状态的和Connection: keep-alive的区别

无状态是指协议对于事物处理没有记忆能力,服务器不知道客户端是什么状态。

HTTP是一个无状态的面向连接的协议,无状态代表HTTP不能保持TCP连接,更不能代表HTTP使用的是UDP协议(无连接)

从HTTP/1.1起,默认都开启了Keep-Alive,保持连接特性,简单说,当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的连接。

Keep-Alive不会永久保持连接,他有一个保持时间,可以在不同的服务器软件(如Apach)中设置这个时间。

 

 

 

 

 

 

 

 

posted @ 2017-08-08 11:26  tong24  阅读(93)  评论(0)    收藏  举报