摘要: 项目信息 内容描述 课程 2025数据采集与融合技术 组名、项目简介 组名: 基米大哈气 项目背景: 针对B站视频评论信息量大、内容杂乱的问题,提供智能化的筛选与分类方案,帮助用户快速了解视频评论风向。 项目目标: 开发一个支持评论爬取、智能分类、违禁词管理及可视化分析的综合系统,实现对评论内容的精 阅读全文
posted @ 2025-12-30 21:06 ygtr3ce 阅读(16) 评论(0) 推荐(0)
摘要: 作业1 要求: 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 候选网站:东方财富网:http://quote.eastmone 阅读全文
posted @ 2025-12-10 10:59 ygtr3ce 阅读(11) 评论(0) 推荐(0)
摘要: 作业1 相关代码与结果 代码 单线程代码如下: 点击查看代码 import requests from bs4 import BeautifulSoup import os import time import urllib.parse class WeatherImageDownloader: d 阅读全文
posted @ 2025-11-25 22:58 ygtr3ce 阅读(23) 评论(0) 推荐(0)
摘要: 作业1 相关代码和结果 点击查看代码 from bs4 import BeautifulSoup from bs4 import UnicodeDammit import urllib.request import sqlite3 class WeatherDatabase: def __init_ 阅读全文
posted @ 2025-11-11 21:12 ygtr3ce 阅读(9) 评论(0) 推荐(0)
摘要: 102302115方朴第一次作业 任务1 代码及运行结果 import requests from bs4 import BeautifulSoup target_url = "http://www.shanghairanking.cn/rankings/bcur/2020" res = reque 阅读全文
posted @ 2025-10-27 19:44 ygtr3ce 阅读(11) 评论(0) 推荐(0)