2024 年 8月随笔档案 - laity17

摘要：

继requests篇和selenium篇，本文是爬取图片的最后一个案例，利用了python第三方库DrissionPage来自动化爬取图片。当然，爬取图片肯定不止这三种方法，还有基于python的scrapy框架，基于node.js的express框架以及基于Java的webmagic框架等等。 DrissionPage和selenium相似，都是基于python的网页自动化工具。不过Drission库的结合了requests和Selenium的优势，既能控制浏览器交互，又能高效地收发数据包。它的主要特点是可以监听网络数据，它可以拦截并解析请求和响应数据包，方便用户进行调试和分析。阅读全文

posted @ 2024-08-22 22:05 laity17 阅读(490) 评论(0) 推荐(0)

爬虫案例1-爬取图片的三种方式之一：selenium篇(2)

摘要：

继使用requests库爬取图片后，本文使用python第三方库selenium来进行图片的爬取，后续也会使用同样是自动化测试工具DrissionPage篇来进行图片的爬取。 selenium是一个用于web应用测试的工具集，它可以直接运行在浏览器中，就像真正的用户在操作一样。它主要应用在自动化测试，web爬虫和自动化任务中。selenium提供了很多编程语言的接口，如java，python，c#等。这让开发者可以自己编写脚本来自动化web应用的测试。本文主要介绍selenium在web爬爬取图片的案例。阅读全文

posted @ 2024-08-20 22:24 laity17 阅读(179) 评论(0) 推荐(0)

爬虫案例1-爬取图片的三种方式之一：requests篇(1)

摘要：

本文分享一个爬虫案例，使用requests库爬取彼岸网中的动物的图片，利用parsel库进行数据解析，并把这些照片保存到本地。后续也会接着分享使用第三方库selenium篇和DrissionPage篇爬取图片。阅读全文

posted @ 2024-08-19 23:53 laity17 阅读(203) 评论(0) 推荐(0)

laity17

08 2024 档案

公告