kukuliii库12321 - 博客园

2025年12月

摘要：项目信息内容描述课程 2025数据采集与融合技术组名、项目简介组名：基米大哈气项目背景：针对B站视频评论信息量大、内容杂乱的问题，提供智能化的筛选与分类方案，帮助用户快速了解视频评论风向。项目目标：开发一个支持评论爬取、智能分类、违禁词管理及可视化分析的综合系统，实现对评论内容的精阅读全文

posted @ 2025-12-30 22:08 kukuliii库12321 阅读(11) 评论(0) 推荐(0)

作业4

摘要： 1.熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。实验内容网页结构在table中的tr为每行元素，td为单个属性核心代码点阅读全文

posted @ 2025-12-10 00:59 kukuliii库12321 阅读(21) 评论(0) 推荐(0)

2025年11月

102302147傅乐宜作业3

摘要： 1.指定一个网站，爬取这个网站中的所有的所有图片，例如：中国气象网（http://www.weather.com.cn）。实现单线程和多线程的方式爬取。内容由于是爬了好几次的网站，所以不放网页结构了核心代码 1.单线程点击查看代码 import requests from bs4 impor 阅读全文

posted @ 2025-11-25 19:53 kukuliii库12321 阅读(19) 评论(0) 推荐(0)

102302147傅乐宜作业2

摘要：在中国气象网给定城市集的7日天气预报，并保存在数据库内容核心代码点击查看代码 import sqlite3 import requests from bs4 import BeautifulSoup class WeatherDB: def __init__(self): self.con = 阅读全文

posted @ 2025-11-10 22:42 kukuliii库12321 阅读(13) 评论(0) 推荐(0)

2025年10月

102302147傅乐宜作业1

摘要： 1.用requests和BeautifulSoup库方法爬取大学排名信息内容核心代码：点击查看代码 import urllib.request from bs4 import BeautifulSoup url = 'http://www.shanghairanking.cn/rankings 阅读全文

posted @ 2025-10-25 21:19 kukuliii库12321 阅读(13) 评论(0) 推荐(0)

公告