会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
wsmlhqqwwn
博客园
首页
新随笔
联系
订阅
管理
2025年12月20日
途知·Bilibili多模态数据采集与AI融合解析
摘要: 这个项目属于哪个课程 2025综合设计——多源异构数据采集与融合应用综合实践 组名、项目简介 组名:往死里爬组项目需求:解决用户从社交媒体(小红书、抖音、B站等)“种草”到实际行程规划之间的巨大鸿沟。提供从信息提取到路线生成的一站式解决方案。项目目标:构建“途知·智能旅行路线规划助手”,利用 LLM
阅读全文
posted @ 2025-12-20 23:37 七年qn
阅读(39)
评论(1)
推荐(0)
2025年12月10日
数据采集技术 - 第四次作业
摘要: 作业①:东方财富网股票数据爬取 作业要求: 熟练掌握 Selenium 查找 HTML 元素、爬取 Ajax 网页数据、等待 HTML 元素等内容。 使用 Selenium 框架 + MySQL 数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 候选网站:东方财
阅读全文
posted @ 2025-12-10 12:36 七年qn
阅读(14)
评论(0)
推荐(0)
2025年11月25日
数据采集技术 - 第三次作业:Scrapy框架与数据库存储
摘要: 作业① 1)、图片爬取实验 1. 实验描述 指定一个网站(以中国气象网为例),爬取该网站下的所有图片。 难点:需分别实现单线程和多线程两种方式,并控制总下载数量不超过学号后3位(130张)。 2. 核心代码 (1) 单线程爬取的实现 首先做的是单线程版本。我的思路是先用 requests 库把网页源
阅读全文
posted @ 2025-11-25 18:30 七年qn
阅读(21)
评论(0)
推荐(0)
2025年11月11日
作业2
摘要: 代码源:https://gitee.com/wsmlhqqwwn/LH/tree/master/作业2 作业①: 要求:在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库。 1.1作业代码和图片: import requests from bs
阅读全文
posted @ 2025-11-11 22:57 七年qn
阅读(31)
评论(0)
推荐(0)
2025年10月27日
数据采集作业1
摘要: 代码源:https://gitee.com/wsmlhqqwwn/LH/tree/master/作业1 1.作业①: 要求:用requests和BeautifulSoup库方法定向爬取给定网址(http://www.shanghairanking.cn/rankings/bcur/2020) 的数据
阅读全文
posted @ 2025-10-27 20:59 七年qn
阅读(13)
评论(0)
推荐(0)
公告