会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
lanyifei
博客园
首页
新随笔
联系
订阅
管理
2025年12月8日
数据采集第四次作业
摘要: 作业一:基于 Selenium + MySQL 的沪深 A 股股票数据爬取 一、作业功能与整体设计思路 1.1 作业功能说明与页面分析(含部分代码与截图) 这次作业的目标是:使用 Selenium 框架 + MySQL 数据库存储,从东方财富网爬取以下 3 个板块的股票数据,并写入本地数据库中: 沪
阅读全文
posted @ 2025-12-08 20:04 lanyifei
阅读(0)
评论(0)
推荐(0)
2025年11月23日
数据采集与融合第三次作业
摘要: 一.爬取中国气象网图片:单线程和多线程各来一遍 作业要求: 任选一个网站,爬取站点里的图片; 必须写单线程版和多线程版两个程序; 要有限制,比如:最大页数用学号后两位控制、最大图片数量用学号后三位控制; 下载时把图片的 URL 打印到控制台,同时把图片保存到本地 images/ 目录; 我选的是中国
阅读全文
posted @ 2025-11-23 17:42 lanyifei
阅读(15)
评论(0)
推荐(0)
2025年11月7日
数据采集与融合第二次作业
摘要: 任务一 代码及思路 首先来看要求 在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库。 由此可知我们要做两件事情 爬取天气预报的数据 将数据保存在数据库中 所以我设置了两个类,一个类ChinaWeatherCrawler负责爬取数据,一个类We
阅读全文
posted @ 2025-11-07 22:12 lanyifei
阅读(30)
评论(0)
推荐(0)
2025年10月22日
1020302118兰逸霏的第一次作业
摘要: 作业一 1.用requests和BeautifulSoup库方法定向爬取给定网址(http://www.shanghairanking.cn/rankings/bcur/2020 )的数据,屏幕打印爬取的大学排名信息。 排名 学校名称 省市 学校类型 总分 1 清华大学 北京 综合 852.5 2.
阅读全文
posted @ 2025-10-22 21:49 lanyifei
阅读(18)
评论(0)
推荐(0)
公告