会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
zjx000
博客园
首页
新随笔
联系
订阅
管理
2025年11月27日
数据采集与技术融合班级作业四102302119庄靖轩
摘要: 数据采集与融合实验报告 作业① 1)实验内容 要求: ▪ 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内 容。 ▪ 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、 “深证A股”3个板块的股票数据信息。 网站:东方财富
阅读全文
posted @ 2025-11-27 09:57 KFC型睦子米
阅读(25)
评论(0)
推荐(0)
2025年11月17日
数据采集与技术融合班级作业三102302119庄靖轩
摘要: 数据采集与融合实验第三次报告 作业1 1)实验内容 要求:指定一个网站,爬取这个网站中的所有的所有图片,中国气象网(http://www.weather.com.cn)。实现单线程和多线程的方式爬取。 代码说明 说一下想法,我先使用了 1.is_jpg_png(url):判断 URL 是否为 .jp
阅读全文
posted @ 2025-11-17 12:05 KFC型睦子米
阅读(14)
评论(0)
推荐(0)
2025年11月2日
班级任务数据采集与融合实验第二次报告
摘要: 数据采集与融合实验第二次报告 作业1 1)实验内容 要求:在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库。 该实验先观察url格式,发现不同城市的页面只和城市代码有关,于是使用url拼接 代码说明 from bs4 import Beaut
阅读全文
posted @ 2025-11-02 16:01 KFC型睦子米
阅读(20)
评论(0)
推荐(0)
2025年10月22日
班级任务数据采集与融合第一次实验报告
摘要: 数据采集与融合实验报告 作业① 1)实验内容 本实验的主要目标是使用 Python 的 requests 与 BeautifulSoup 库定向爬取"2020中国大学排名"网页数据。页面中包含完整的大学排名表格数据,包括排名、学校名称、省市、学校类型以及综合得分等字段。 程序通过 requests
阅读全文
posted @ 2025-10-22 18:06 KFC型睦子米
阅读(11)
评论(0)
推荐(0)
公告