打开一个网站
import urllib #引入url库
def getUrlList(): #定义一个函数
res=urllib.urlopen(‘http://www.budejie.com/vedio’) #打开一个网站
html=res.read() #取得其中的html
print(html)
import urllib2
req=urllib2.Request('http://www.budejie.com/video/')
req.add_header('User-Agent','Mozilla/5.0(Windows NT 6.1;Win64;x64)AppleWebkit/537.36(KHTML,like Gecko)chrome/60.0.3112.90 Safari/537.36')
res=urllib2.urlopen(reg)
html=res.read()
getUrlList()
print (html)
import urllib2
req=urllib2.Request('http://www.budejie.com/video/')
req.add_header('User-Agent','Mozilla/5.0(Windows NT 6.1;Win64;x64)AppleWebkit/537.36(KHTML,like Gecko)chrome/60.0.3112.90 Safari/537.36')
res=urllib2.urlopen(reg)
html=res.read()
reg=r'data-mp4="(.*?)“>' #. 除了换行符和制表符以外的其它任意字符
urlLIst=re.findall(reg,html)
n=1
for url in urlList:
urllib.urlretrieve(url,'mp4/%d.mp4' %n)
n+=1
getUrlList()
print (html)

浙公网安备 33010602011771号