摘要: 数据挖掘第五次实践 作业一 京东信息爬取实验 作业内容 要求:熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 使用Selenium框架爬取京东商城某类商品信息及图片。 候选网站:http://www.jd.com/ 关键词:学生自由选择 实践过程 将老师 阅读全文
posted @ 2021-11-24 21:51 JIE404 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 数据挖掘第四次实践 作业一 当当图书爬取实验 作业内容 要求:熟练掌握 scrapy 中 Item、Pipeline 数据的序列化输出方法; Scrapy+Xpath+MySQL数据库存储技术路线爬取当当网站图书数据 候选网站:http://www.dangdang.com/ 关键词:学生自由选择 阅读全文
posted @ 2021-11-11 13:00 JIE404 阅读(32) 评论(0) 推荐(0) 编辑
摘要: 数据挖掘第三次实践 作业一 天气图片爬取实验 作业内容 指定一个网站,爬取这个网站中的所有的所有图片,例如中国气象网(http://www.weather.com.cn)。分别使用单线程和多线程的方式爬取。(限定爬取图片数量为学号后3位) 实践过程 获取网页中可访问链接 网页链接可通过xpath中提 阅读全文
posted @ 2021-10-28 20:36 JIE404 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 斗量车联需求分析报告 在线查看 第七组需求分析报告链接 文件下载 第七组需求分析报告下载链接 阅读全文
posted @ 2021-10-17 20:25 JIE404 阅读(188) 评论(47) 推荐(3) 编辑
摘要: 作业一 天气数据爬取实验 作业内容 在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库 实践过程 信息定位 F12查看页面元素后发现,所需信息位于ul下的li标签中 li标签中元素较少,且信息较为简单,所以直接使用li.text获取字符串后,再 阅读全文
posted @ 2021-10-13 22:29 JIE404 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 项目选题报告链接: 第七组-斗量车联选题报告(点击下载) 以下内容仅为项目选题报告节选 若需查看完整内容请点击上方链接下载文件 会议图片 项目概述 项目背景及意义 在校园生活中,电动车由于其便利性与快捷性,成为多数同学的主要通勤工具,但在享受方便快捷的生活同时,由于电动车引发的问题却接踵而至。难以找 阅读全文
posted @ 2021-10-04 10:08 JIE404 阅读(211) 评论(65) 推荐(1) 编辑
摘要: 实验一 实验源代码见:https://gitee.com/jie-zheng/crawl_project/tree/master/%E4%BD%9C%E4%B8%9A1 作业一 作业内容: **要求:**用urllib和re库方法定向爬取给定网址(https://www.shanghairankin 阅读全文
posted @ 2021-09-30 00:00 JIE404 阅读(43) 评论(0) 推荐(0) 编辑