爬取网页的通用代码框架

import requests
def getHTMLText(url)
    try:
        r = requests.get(url,timeout=30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "产生异常"
    if__name__== "__main__"
          url = "http://www.baidu.com"
         print(getHTMLText(url))

posted @ 2018-11-06 20:45 西柠58 阅读(225) 评论(0) 收藏举报

刷新页面返回顶部

西柠58

爬取网页的通用代码框架

公告