该如何学习网络爬虫

什么是网络爬虫?

       网络爬虫,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。

爬虫能干什么?

       模拟人打开浏览器,快速从网页中获取我们想要的那部分数据。

如何学习爬虫呢?

       爬虫是模拟人打开浏览器获取数据,那人是如何从浏览器上面获取想要的数据呢?打开浏览器,输入关键字开始搜索。然后浏览器就会给你返回一些内容。这里就对应的是发送请求,获取响应。Python提供了非常强大的第三方库和框架。我们不需要太注重代码的编写,应该注重逻辑。给自己提三个问题:

  1. 要做什么
  2. 如何去做
  3. 怎样做简单

第一次写,不喜勿喷。

posted @ 2020-02-03 17:05  吃掉这颗薄荷糖  阅读(339)  评论(0)    收藏  举报