会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
wsmlhqqwwn
博客园
首页
新随笔
联系
订阅
管理
2025年12月10日
数据采集技术 - 第四次作业
摘要: 作业①:东方财富网股票数据爬取 作业要求: 熟练掌握 Selenium 查找 HTML 元素、爬取 Ajax 网页数据、等待 HTML 元素等内容。 使用 Selenium 框架 + MySQL 数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 候选网站:东方财
阅读全文
posted @ 2025-12-10 12:36 七年qn
阅读(4)
评论(0)
推荐(0)
2025年11月25日
数据采集技术 - 第三次作业:Scrapy框架与数据库存储
摘要: 作业① 1)、图片爬取实验 1. 实验描述 指定一个网站(以中国气象网为例),爬取该网站下的所有图片。 难点:需分别实现单线程和多线程两种方式,并控制总下载数量不超过学号后3位(130张)。 2. 核心代码 (1) 单线程爬取的实现 首先做的是单线程版本。我的思路是先用 requests 库把网页源
阅读全文
posted @ 2025-11-25 18:30 七年qn
阅读(12)
评论(0)
推荐(0)
2025年11月11日
作业2
摘要: 代码源:https://gitee.com/wsmlhqqwwn/LH/tree/master/作业2 作业①: 要求:在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库。 1.1作业代码和图片: import requests from bs
阅读全文
posted @ 2025-11-11 22:57 七年qn
阅读(15)
评论(0)
推荐(0)
2025年10月27日
数据采集作业1
摘要: 代码源:https://gitee.com/wsmlhqqwwn/LH/tree/master/作业1 1.作业①: 要求:用requests和BeautifulSoup库方法定向爬取给定网址(http://www.shanghairanking.cn/rankings/bcur/2020)的数据,
阅读全文
posted @ 2025-10-27 20:59 七年qn
阅读(7)
评论(0)
推荐(0)
公告