11 2021 档案

数据采集第四次作业

摘要：数据采集第四次作业作业1 ： ###1、实验内容 ####要求：熟练掌握 scrapy 中 Item、Pipeline 数据的序列化输出方法；Scrapy+Xpath+MySQL数据库存储技术路线爬取当当网站图书数据候选网站：http://search.dangdang.com/?key=py 阅读全文

posted @ 2021-11-23 21:34 0x42bd82a1

数据采集第三次作业

摘要：数据采集第三次作业作业1 ： ###1、实验内容 ####要求：指定一个网站，爬取这个网站中的所有的所有图片，例如中国气象网（http://www.weather.com.cn）。分别使用单线程和多线程的方式爬取。(限定爬取图片数量为学号后4位) 输出信息: ####输出信息：将下载的Url信阅读全文

posted @ 2021-11-09 19:38 0x42bd82a1 阅读(42) 评论(0) 推荐(0)

0x42bd82a1

11 2021 档案

公告