摘要: 作业① 要求:指定一个网站,爬取这个网站中的所有的所有图片,例如中国气象网(http://www.weather.com.cn)。分别使用单线程和多线程的方式爬取。(限定爬取图片数量为学号后3位) 输出信息:将下载的Url信息在控制台输出,并将下载的图片存储在images子文件夹中,并给出截图。 实 阅读全文
posted @ 2022-01-11 15:27 抱着欣欣看月亮 阅读(39) 评论(0) 推荐(0) 编辑
摘要: 作业① 1)爬取当当网站图书数据 要求:熟练掌握 scrapy 中 Item、Pipeline 数据的序列化输出方法;Scrapy+Xpath+MySQL数据库存储技术路线爬取当当网站图书数据 候选网站:http://search.dangdang.com/?key=python&act=input 阅读全文
posted @ 2022-01-11 15:18 抱着欣欣看月亮 阅读(45) 评论(0) 推荐(0) 编辑