摘要: 这个项目属于哪个课程 2025综合设计——多源异构数据采集与融合应用综合实践 组名、项目简介 组名:往死里爬组项目需求:解决用户从社交媒体(小红书、抖音、B站等)“种草”到实际行程规划之间的巨大鸿沟。提供从信息提取到路线生成的一站式解决方案。项目目标:构建“途知·智能旅行路线规划助手”,利用 LLM 阅读全文
posted @ 2025-12-20 23:37 七年qn 阅读(39) 评论(1) 推荐(0)
摘要: 作业①:东方财富网股票数据爬取 作业要求: 熟练掌握 Selenium 查找 HTML 元素、爬取 Ajax 网页数据、等待 HTML 元素等内容。 使用 Selenium 框架 + MySQL 数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 候选网站:东方财 阅读全文
posted @ 2025-12-10 12:36 七年qn 阅读(14) 评论(0) 推荐(0)
摘要: 作业① 1)、图片爬取实验 1. 实验描述 指定一个网站(以中国气象网为例),爬取该网站下的所有图片。 难点:需分别实现单线程和多线程两种方式,并控制总下载数量不超过学号后3位(130张)。 2. 核心代码 (1) 单线程爬取的实现 首先做的是单线程版本。我的思路是先用 requests 库把网页源 阅读全文
posted @ 2025-11-25 18:30 七年qn 阅读(21) 评论(0) 推荐(0)
摘要: 代码源:https://gitee.com/wsmlhqqwwn/LH/tree/master/作业2 作业①: 要求:在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库。 1.1作业代码和图片: import requests from bs 阅读全文
posted @ 2025-11-11 22:57 七年qn 阅读(31) 评论(0) 推荐(0)
摘要: 代码源:https://gitee.com/wsmlhqqwwn/LH/tree/master/作业1 1.作业①: 要求:用requests和BeautifulSoup库方法定向爬取给定网址(http://www.shanghairanking.cn/rankings/bcur/2020) 的数据 阅读全文
posted @ 2025-10-27 20:59 七年qn 阅读(13) 评论(0) 推荐(0)