打开一个网站

import urllib #引入url库

def getUrlList(): #定义一个函数

res=urllib.urlopen（‘http://www.budejie.com/vedio’） #打开一个网站

html=res.read() #取得其中的html

print(html)

import urllib2

req=urllib2.Request('http://www.budejie.com/video/')

req.add_header('User-Agent','Mozilla/5.0(Windows NT 6.1;Win64;x64)AppleWebkit/537.36(KHTML,like Gecko)chrome/60.0.3112.90 Safari/537.36')

res=urllib2.urlopen(reg)

html=res.read()

getUrlList()

print (html)

import urllib2

req=urllib2.Request('http://www.budejie.com/video/')

req.add_header('User-Agent','Mozilla/5.0(Windows NT 6.1;Win64;x64)AppleWebkit/537.36(KHTML,like Gecko)chrome/60.0.3112.90 Safari/537.36')

res=urllib2.urlopen(reg)

html=res.read()

reg=r'data-mp4="（.*?）“>' #. 除了换行符和制表符以外的其它任意字符

urlLIst=re.findall(reg,html)

n=1

for url in urlList:

urllib.urlretrieve(url,'mp4/%d.mp4' %n)

n+=1

getUrlList()

print (html)

posted @ 2018-07-11 09:07 21keya 阅读(1240) 评论(0) 收藏举报

刷新页面返回顶部

21keya