摘要: Python 标准库中有很多实用的工具类,但是在具体使用时,标准库文档上对使用细节描述的并不清楚,比如 urllib2 这个 HTTP 客户端库。这里总结了一些 urllib2 库的使用细节。1 Proxy 的设置2 Timeout 设置3 在 HTTP Request 中加入特定的 Header4 Redirect5 Cookie6 使用 HTTP 的 PUT 和 DELETE 方法7 得到 HTTP 的返回码8 Debug Log1 Proxy 的设置urllib2 默认会使用环境变量 http_proxy 来设置 HTTP Proxy。如果想在程序中明确控制 Proxy,而不受环境变量的 阅读全文
posted @ 2012-10-19 18:02 爱小明 阅读(127) 评论(0) 推荐(0)
摘要: 简介:urllib2是python的一个获取url(Uniform Resource Locators,统一资源定址器)的模块。它用urlopen函数的形式提供了一个非常简洁的接口。这使得用各种各样的协议获取url成为可能。它同时 也提供了一个稍微复杂的接口来处理常见的状况-如基本的认证,cookies,代理,等等。这些都是由叫做opener和handler的对象来处理的。以下是获取url最简单的方式:import urllib2response = urllib2.urlopen('http://python.org/')html = response.read()许多url 阅读全文
posted @ 2012-10-19 13:47 爱小明 阅读(130) 评论(0) 推荐(0)