11 2021 档案

摘要:数据采集第四次作业 作业1 : ###1、实验内容 ####要求: 熟练掌握 scrapy 中 Item、Pipeline 数据的序列化输出方法;Scrapy+Xpath+MySQL数据库存储技术路线爬取当当网站图书数据 候选网站:http://search.dangdang.com/?key=py 阅读全文
posted @ 2021-11-23 21:34 0x42bd82a1
摘要:数据采集第三次作业 作业1 : ###1、实验内容 ####要求: 指定一个网站,爬取这个网站中的所有的所有图片,例如中国气象网(http://www.weather.com.cn)。分别使用单线程和多线程的方式爬取。(限定爬取图片数量为学号后4位) 输出信息: ####输出信息: 将下载的Url信 阅读全文
posted @ 2021-11-09 19:38 0x42bd82a1 阅读(42) 评论(0) 推荐(0)