08 2024 档案

摘要:爬虫案例1-爬取图片的三种方式之一:DrissionPage篇(3)继requests篇和selenium篇,本文是爬取图片的最后一个案例,利用了python第三方库DrissionPage来自动化爬取图片。当然,爬取图片肯定不止这三种方法,还有基于python的scrapy框架,基于node.js的express框架以及基于Java的webmagic框架等等。 DrissionPage和selenium相似,都是基于python的网页自动化工具。不过Drission库的结合了requests和Selenium的优势,既能控制浏览器交互,又能高效地收发数据包。它的主要特点是可以监听网络数据,它可以拦截并解析请求和响应数据包,方便用户进行调试和分析。 阅读全文
posted @ 2024-08-22 22:05 laity17 阅读(490) 评论(0) 推荐(0)
摘要:爬虫案例1-爬取图片的三种方式之一:selenium篇(2)继使用requests库爬取图片后,本文使用python第三方库selenium来进行图片的爬取,后续也会使用同样是自动化测试工具DrissionPage篇来进行图片的爬取。 selenium是一个用于web应用测试的工具集,它可以直接运行在浏览器中,就像真正的用户在操作一样。它主要应用在自动化测试,web爬虫和自动化任务中。selenium提供了很多编程语言的接口,如java,python,c#等。这让开发者可以自己编写脚本来自动化web应用的测试。本文主要介绍selenium在web爬爬取图片的案例。 阅读全文
posted @ 2024-08-20 22:24 laity17 阅读(179) 评论(0) 推荐(0)
摘要:爬虫案例1-爬取图片的三种方式之一:requests篇(1)本文分享一个爬虫案例,使用requests库爬取彼岸网中的动物的图片,利用parsel库进行数据解析,并把这些照片保存到本地。后续也会接着分享使用第三方库selenium篇和DrissionPage篇爬取图片。 阅读全文
posted @ 2024-08-19 23:53 laity17 阅读(203) 评论(0) 推荐(0)