流留六刘 - 博客园

2025年12月19日

摘要：项目信息内容描述课程 2025数据采集与融合技术组名、项目简介组名：基米大哈气项目背景：针对B站视频评论信息量大、内容杂乱的问题，提供智能化的筛选与分类方案，帮助用户快速了解视频评论风向。项目目标：开发一个支持评论爬取、智能分类、违禁词管理及可视化分析的综合系统，实现对评论内容的精阅读全文

posted @ 2025-12-19 13:48 流留六刘阅读(15) 评论(0) 推荐(0)

2025年12月7日

作业4

摘要：作业①: 要求：熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。候选网站：东方财富网：http://quote.eastmone 阅读全文

posted @ 2025-12-07 17:43 流留六刘阅读(27) 评论(0) 推荐(0)

2025年11月23日

作业3

摘要：作业1 1.气象网页爬取实验实验要求指定一个网站，爬取这个网站中的所有的所有图片，中国气象网（http://www.weather.com.cn）。实现单线程和多线程的方式爬取。输出信息：将下载的图片保存在images子文件夹中导入库： requests：发送请求获取数据 Beautiful 阅读全文

posted @ 2025-11-23 13:21 流留六刘阅读(32) 评论(0) 推荐(0)

2025年11月9日

作业2

摘要：作业① 实验要求在中国气象网（http://www.weather.com.cn）给定城市集的7日天气预报，并保存在数据库。思路：爬取数据方面如之前作业，查看网页源代码，发现天气数据在"li class"属性下，采用requesets和bs4进行爬取，之后采用sqlite3将数据存入 SQLite 阅读全文

posted @ 2025-11-09 11:48 流留六刘阅读(27) 评论(0) 推荐(0)

2025年10月27日

作业1

摘要：作业① 1.大学排名动态网页爬取实验实验要求用requests和BeautifulSoup库方法定向爬取给定网址（http://www.shanghairanking.cn/rankings/bcur/2020 ）的数据，屏幕打印爬取的大学排名信息。思路：（1）查看网页，发现为静态网页，且没有阅读全文

posted @ 2025-10-27 14:20 流留六刘阅读(21) 评论(0) 推荐(0)

liuliulilu

公告