摘要: 爬虫原理 浏览器获取网页内容的步骤:浏览器提交请求、下载网页代码、解析成页面,爬虫要做的就是: 简单例子:利用Urllib库爬取w3c网站教程 1、urllib的request模块可以非常方便地抓取URL内容,也就是发送一个GET请求到指定的页面,然后返回HTTP的响应:例如,对百度的一个w3c发送 阅读全文
posted @ 2019-03-22 09:19 fish's dream 阅读(756) 评论(0) 推荐(2) 编辑