摘要: urllib库 urllib库是Python中一个最基本的网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。 发送请求 简单的请求 urllib.request.urlopen(url,data=None,[timeout, ]*,cafile=None,ca 阅读全文
posted @ 2021-03-26 22:38 KKKyrie 阅读(578) 评论(0) 推荐(0) 编辑
摘要: 什么是爬虫: 爬虫是一个模拟人类请求网站行为的程序。可以自动请求网页、并把数据抓取下来,然后使用一定的规则提取有价值的数据。 Http协议: Http协议介绍: Http协议:全称是HyperText Transfer Protocol,中文意思是超文本传输协议,是一种发布和接收HTML(Hyper 阅读全文
posted @ 2021-03-26 20:59 KKKyrie 阅读(266) 评论(0) 推荐(0) 编辑