摘要:
众所周知,最基本的记载方式分为两种。一种为同步,一种为异步。 那么该如何区分同步和异步呢??? 教一个简单的方式。看一下左上角的刷新按钮,如果他动了就是同步,没变化就是异步(自己的认识方式)。 那么以腾讯新闻为例,她是一个妥妥的一个异步加载,并且返回的对象是一个json字符串格式。 打开抓包工具,选 阅读全文
posted @ 2022-10-09 18:53
南潇
阅读(358)
评论(0)
推荐(0)
摘要:
1.图片的加载信息只有两种,(个人认为,目前只遇到过两种) - 同步加载 - 异步加载 2.(1)同步加载,在你返回的数据中可以清晰的看到,你所需要的数据全部都在你所打印的response中,也就是说,可以找到想想要的数据。那么只需要一个简单的模板就可以爬取你想要的数据信息,以及图片信息。 (2)异 阅读全文
posted @ 2022-10-09 14:44
南潇
阅读(65)
评论(0)
推荐(0)
摘要:
1.创建一个scrapy项目 scrapy startgproject tupian cd tupian 创建爬虫文件 scrapy genspider Image www.com(域名)后续需要更改 开通pip管道是需要注意,我们将之前的类注释了,所以我们需要将原来的pip管道的名称加以修改 在终 阅读全文
posted @ 2022-10-09 13:16
南潇
阅读(49)
评论(0)
推荐(0)
摘要:
校花网的信息资源都可以在我们打印出来的响应对象中找到,所以说,校花网的加载方式是属于静态加载的,所以,我们就可以直接在scrapy框架中的爬虫文件档中将我们所需要的信息全部爬取下来。 1.新建一个scrapy项目文件 在我们的pycharm当中有一个Terminal,我们点击他,就回出现以下。 这里 阅读全文
posted @ 2022-10-09 12:32
南潇
阅读(49)
评论(0)
推荐(0)

浙公网安备 33010602011771号