会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
lsy888
博客园
首页
新随笔
联系
订阅
管理
2025年12月7日
数据采集与融合技术作业四_102302107_林诗樾
摘要: 作业①: 要求: 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 候选网站:东方财富网:http://quote.eastmon
阅读全文
posted @ 2025-12-07 15:13 ls樾
阅读(14)
评论(0)
推荐(0)
2025年11月23日
数据科学与大数据技术作业三_102302107_林诗樾
摘要: 第三次作业 一、作业内容 作业①: 要求:指定一个网站,爬取这个网站中的所有的所有图片,例如:中国气象网(http://www.weather.com.cn)。实现单线程和多线程的方式爬取。 –务必控制总页数(学号尾数2位)、总下载的图片数量(尾数后3位)等限制爬取的措施。 (1)代码 import
阅读全文
posted @ 2025-11-23 14:12 ls樾
阅读(11)
评论(0)
推荐(0)
2025年11月5日
数据采集与融合技术实践作业2_102302107_林诗樾
摘要: 作业①: –要求:在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库。 –输出信息: Gitee文件夹链接 1)实验代码和运行结果 import requests from bs4 import BeautifulSoup import pan
阅读全文
posted @ 2025-11-05 14:33 ls樾
阅读(22)
评论(0)
推荐(0)
2025年10月28日
102302107_林诗樾_数据采集与融合技术实践作业1
摘要: 作业① 1)、上海软科2020大学排名爬取实验(requests+BeautifulSoup) import requests from bs4 import BeautifulSoup import warnings warnings.filterwarnings("ignore") # 忽略SS
阅读全文
posted @ 2025-10-28 18:45 ls樾
阅读(12)
评论(0)
推荐(0)
公告