会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
JIE404
博客园
首页
新随笔
联系
订阅
管理
2021年11月24日
数据采集与融合技术第五次实践
摘要: 数据挖掘第五次实践 作业一 京东信息爬取实验 作业内容 要求:熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 使用Selenium框架爬取京东商城某类商品信息及图片。 候选网站:http://www.jd.com/ 关键词:学生自由选择 实践过程 将老师
阅读全文
posted @ 2021-11-24 21:51 JIE404
阅读(65)
评论(0)
推荐(0)
2021年11月11日
数据采集与融合技术第四次作业
摘要: 数据挖掘第四次实践 作业一 当当图书爬取实验 作业内容 要求:熟练掌握 scrapy 中 Item、Pipeline 数据的序列化输出方法; Scrapy+Xpath+MySQL数据库存储技术路线爬取当当网站图书数据 候选网站:http://www.dangdang.com/ 关键词:学生自由选择
阅读全文
posted @ 2021-11-11 13:00 JIE404
阅读(64)
评论(0)
推荐(0)
2021年10月28日
数据采集与融合技术第三次作业
摘要: 数据挖掘第三次实践 作业一 天气图片爬取实验 作业内容 指定一个网站,爬取这个网站中的所有的所有图片,例如中国气象网(http://www.weather.com.cn)。分别使用单线程和多线程的方式爬取。(限定爬取图片数量为学号后3位) 实践过程 获取网页中可访问链接 网页链接可通过xpath中提
阅读全文
posted @ 2021-10-28 20:36 JIE404
阅读(67)
评论(0)
推荐(0)
2021年10月17日
第3次软工任务 需求分析 第七组
摘要: 斗量车联需求分析报告 在线查看 第七组需求分析报告链接 文件下载 第七组需求分析报告下载链接
阅读全文
posted @ 2021-10-17 20:25 JIE404
阅读(197)
评论(47)
推荐(3)
2021年10月13日
数据采集与融合技术第二次作业
摘要: 作业一 天气数据爬取实验 作业内容 在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库 实践过程 信息定位 F12查看页面元素后发现,所需信息位于ul下的li标签中 li标签中元素较少,且信息较为简单,所以直接使用li.text获取字符串后,再
阅读全文
posted @ 2021-10-13 22:29 JIE404
阅读(89)
评论(0)
推荐(0)
2021年10月4日
软工第二次作业-斗量车联项目选题报告
摘要: 项目选题报告链接: 第七组-斗量车联选题报告(点击下载) 以下内容仅为项目选题报告节选 若需查看完整内容请点击上方链接下载文件 会议图片 项目概述 项目背景及意义 在校园生活中,电动车由于其便利性与快捷性,成为多数同学的主要通勤工具,但在享受方便快捷的生活同时,由于电动车引发的问题却接踵而至。难以找
阅读全文
posted @ 2021-10-04 10:08 JIE404
阅读(258)
评论(65)
推荐(1)
2021年9月30日
数据采集与融合技术第一次作业
摘要: 实验一 实验源代码见:https://gitee.com/jie-zheng/crawl_project/tree/master/%E4%BD%9C%E4%B8%9A1 作业一 作业内容: **要求:**用urllib和re库方法定向爬取给定网址(https://www.shanghairankin
阅读全文
posted @ 2021-09-30 00:00 JIE404
阅读(65)
评论(0)
推荐(0)
公告