打开一个网站

import urllib   #引入url库

def getUrlList():   #定义一个函数

       res=urllib.urlopen(‘http://www.budejie.com/vedio’) #打开一个网站

       html=res.read()    #取得其中的html

       print(html)

 

import urllib2

        req=urllib2.Request('http://www.budejie.com/video/')

        req.add_header('User-Agent','Mozilla/5.0(Windows NT 6.1;Win64;x64)AppleWebkit/537.36(KHTML,like Gecko)chrome/60.0.3112.90 Safari/537.36')

      res=urllib2.urlopen(reg)

    html=res.read()

getUrlList()

    print (html)

 

import urllib2

        req=urllib2.Request('http://www.budejie.com/video/')

        req.add_header('User-Agent','Mozilla/5.0(Windows NT 6.1;Win64;x64)AppleWebkit/537.36(KHTML,like Gecko)chrome/60.0.3112.90 Safari/537.36')

      res=urllib2.urlopen(reg)

    html=res.read()

 reg=r'data-mp4="(.*?)“>'      #.  除了换行符和制表符以外的其它任意字符

urlLIst=re.findall(reg,html)

n=1

for url in urlList:

    urllib.urlretrieve(url,'mp4/%d.mp4' %n)

   n+=1

getUrlList()

    print (html)

 

posted @ 2018-07-11 09:07  21keya  阅读(1239)  评论(0)    收藏  举报