(学习)爬取网页的通用代码框架

 1 import requests
 2 def getHTMLText(url):
 3     try:
 4         r=requests.get(url,timeout=30)
 5         r.raise_for_status()
 6         r.encoding=r.apparent_encoding
 7         return r.text
 8     except:
 9         return "产生异常"
10 
11     
12 if __name__=="__main__":
13     url="http://www.baidu.com"
14     print(getHTMLText(url))

2019-06-19

1、注意if 后面的空格

2、介绍为什么用

if __name__=="__main__":的链接

https://blog.csdn.net/qq_27017791/article/details/80212016

posted @ 2019-06-19 16:44  一样的我们  阅读(202)  评论(0)    收藏  举报