摘要: 数据采集与融合实验报告 作业① 1)实验内容 要求: ▪ 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内 容。 ▪ 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、 “深证A股”3个板块的股票数据信息。 网站:东方财富 阅读全文
posted @ 2025-11-27 09:57 KFC型睦子米 阅读(25) 评论(0) 推荐(0)
摘要: 数据采集与融合实验第三次报告 作业1 1)实验内容 要求:指定一个网站,爬取这个网站中的所有的所有图片,中国气象网(http://www.weather.com.cn)。实现单线程和多线程的方式爬取。 代码说明 说一下想法,我先使用了 1.is_jpg_png(url):判断 URL 是否为 .jp 阅读全文
posted @ 2025-11-17 12:05 KFC型睦子米 阅读(14) 评论(0) 推荐(0)
摘要: 数据采集与融合实验第二次报告 作业1 1)实验内容 要求:在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库。 该实验先观察url格式,发现不同城市的页面只和城市代码有关,于是使用url拼接 代码说明 from bs4 import Beaut 阅读全文
posted @ 2025-11-02 16:01 KFC型睦子米 阅读(20) 评论(0) 推荐(0)
摘要: 数据采集与融合实验报告 作业① 1)实验内容 本实验的主要目标是使用 Python 的 requests 与 BeautifulSoup 库定向爬取"2020中国大学排名"网页数据。页面中包含完整的大学排名表格数据,包括排名、学校名称、省市、学校类型以及综合得分等字段。 程序通过 requests 阅读全文
posted @ 2025-10-22 18:06 KFC型睦子米 阅读(11) 评论(0) 推荐(0)