摘要:
urllib库 urllib库是Python中一个最基本的网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。 发送请求 简单的请求 urllib.request.urlopen(url,data=None,[timeout, ]*,cafile=None,ca 阅读全文
摘要:
什么是爬虫: 爬虫是一个模拟人类请求网站行为的程序。可以自动请求网页、并把数据抓取下来,然后使用一定的规则提取有价值的数据。 Http协议: Http协议介绍: Http协议:全称是HyperText Transfer Protocol,中文意思是超文本传输协议,是一种发布和接收HTML(Hyper 阅读全文