python urllib

import urllib

print urllib.urlopen(r'http://image.baidu.com/i?tn=baiduimage&ct=201326592&lm=-1&cl=2&fr=ala0&word=%C5%AE%C8%CB&fr=ala_meinv').read()

 

使用wireshark抓包

显示npf没有启动的解决方法: net start npf, 显示“拒绝访问5”。

改用管理员方式运行cmd.exe,  OK

 

python urllib 超时设置

import socket 
socket.setdefaulttimeout(5.0) 
 

Python模块学习 --- urllib

http://www.blogjava.net/ashutc/archive/2011/03/21/346695.html
import urllib
print urllib.urlopen('http://www.google.com').read()
 

urllib.urlretrieve(url[, filename[, reporthook[, data]]]):
urlretrieve方法直接将远程数据下载到本地。

 

def cbk(a, b, c):
'''回调函数
    @a: 已经下载的数据块
    @b: 数据块的大小
    @c: 远程文件的大小
'''
    per = 100.0 * a * b / c
if per > 100:
        per = 100
    print '%.2f%%' % per
url = 'http://www.sina.com.cn'
local = 'd:\\sina.html'
urllib.urlretrieve(url, local, cbk)

posted @ 2014-07-28 17:06  aprial  阅读(228)  评论(0编辑  收藏  举报