摘要: 作业①: 要求: 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 **候选网站:**豆瓣电影:https://movie.douban.com/top250 1)爬取豆瓣实验: 代码部分: 阅读全文
posted @ 2020-12-02 22:32 Incwu 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 作业①: 要求: **候选网站:**http://www.jd.com/ **关键词:**学生自由选择 1)爬取京东实验: 2.编写代码: from selenium import webdriver from selenium.webdriver.chrome.options import Opt 阅读全文
posted @ 2020-11-21 23:00 Incwu 阅读(100) 评论(0) 推荐(0) 编辑
摘要: 作业①: **要求:**熟练掌握 scrapy 中 Item、Pipeline 数据的序列化输出方法;Scrapy+Xpath+MySQL数据库存储技术路线爬取当当网站图书数据 **候选网站:**http://www.dangdang.com/ **关键词:**学生自由选择 1)爬取当当网实验: 1 阅读全文
posted @ 2020-11-03 22:24 Incwu 阅读(86) 评论(0) 推荐(0) 编辑
摘要: 1.团队基本情况 1.1团队项目整体计划安排 项目分工表 工种 组员 任务 统筹 陈晟新 考察任务进度,负责人员调度,后端研究 美工 李佳乐 UI设计,原型设计,细化用户需求 测试 孙晴晴 测试方案制定,评测测试系统 服务器 吴洁颖 研究服务器方面的需求 网页 陈小楚,何文龙 网页的制作,交互的实现 阅读全文
posted @ 2020-11-01 19:51 Incwu 阅读(100) 评论(0) 推荐(0) 编辑
摘要: 第二次作业 作业①: **要求:**指定一个网站,爬取这个网站中的所有的所有图片,例如中国气象网(http://www.weather.com.cn)。分别使用单线程和多线程的方式爬取。 输出信息: 将下载的Url信息在控制台输出,并将下载的图片存储在images子文件中,并给出截图。 1)Weat 阅读全文
posted @ 2020-10-20 22:43 Incwu 阅读(157) 评论(0) 推荐(0) 编辑
摘要: 爬爬爬爬 阅读全文
posted @ 2020-10-08 00:47 Incwu 阅读(203) 评论(0) 推荐(0) 编辑
摘要: 爬爬爬 阅读全文
posted @ 2020-09-29 14:01 Incwu 阅读(359) 评论(0) 推荐(0) 编辑