七年qn - 博客园

2025年12月20日

摘要：这个项目属于哪个课程 2025综合设计——多源异构数据采集与融合应用综合实践组名、项目简介组名：往死里爬组项目需求：解决用户从社交媒体（小红书、抖音、B站等）“种草”到实际行程规划之间的巨大鸿沟。提供从信息提取到路线生成的一站式解决方案。项目目标：构建“途知·智能旅行路线规划助手”，利用 LLM 阅读全文

posted @ 2025-12-20 23:37 七年qn 阅读(44) 评论(1) 推荐(0)

2025年12月10日

数据采集技术 - 第四次作业

摘要：作业①：东方财富网股票数据爬取作业要求：熟练掌握 Selenium 查找 HTML 元素、爬取 Ajax 网页数据、等待 HTML 元素等内容。使用 Selenium 框架 + MySQL 数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。候选网站：东方财阅读全文

posted @ 2025-12-10 12:36 七年qn 阅读(17) 评论(0) 推荐(0)

2025年11月25日

数据采集技术 - 第三次作业：Scrapy框架与数据库存储

摘要：作业① 1）、图片爬取实验 1. 实验描述指定一个网站（以中国气象网为例），爬取该网站下的所有图片。难点：需分别实现单线程和多线程两种方式，并控制总下载数量不超过学号后3位（130张）。 2. 核心代码 (1) 单线程爬取的实现首先做的是单线程版本。我的思路是先用 requests 库把网页源阅读全文

posted @ 2025-11-25 18:30 七年qn 阅读(26) 评论(0) 推荐(0)

2025年11月11日

作业2

摘要：代码源：https://gitee.com/wsmlhqqwwn/LH/tree/master/作业2 作业①: 要求：在中国气象网（http://www.weather.com.cn）给定城市集的7日天气预报，并保存在数据库。 1.1作业代码和图片： import requests from bs 阅读全文

posted @ 2025-11-11 22:57 七年qn 阅读(35) 评论(0) 推荐(0)

2025年10月27日

数据采集作业1

摘要：代码源：https://gitee.com/wsmlhqqwwn/LH/tree/master/作业1 1.作业①: 要求：用requests和BeautifulSoup库方法定向爬取给定网址（http://www.shanghairanking.cn/rankings/bcur/2020）的数据阅读全文

posted @ 2025-10-27 20:59 七年qn 阅读(20) 评论(0) 推荐(0)

wsmlhqqwwn

公告