许志安xza - 博客园

2025年12月30日

摘要：课程 2025数据采集与融合技术项目整体组名、项目简介组名：基米大哈气项目背景：针对B站视频评论信息量大、内容杂乱的问题，提供智能化的筛选与分类方案，帮助用户快速了解视频评论风向。项目目标：开发一个支持评论爬取、智能分类、违禁词管理及可视化分析的综合系统，实现对评论内容的精准筛选与多维度展阅读全文

posted @ 2025-12-30 21:50 许志安xza 阅读(11) 评论(0) 推荐(0)

2025年12月9日

102302122许志安作业4

摘要：数据采集第四次作业作业一：基于 Selenium + MySQL 的沪深 A 股股票数据爬取要求： ▪ 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 ▪ 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、 “ 阅读全文

posted @ 2025-12-09 17:50 许志安xza 阅读(20) 评论(0) 推荐(0)

2025年11月23日

102302122许志安作业3

摘要：要求：指定一个网站，爬取这个网站中的所有的所有图片，例如中国气象网（http://www.weather.com.cn）。实现单线程和多线程的方式爬取。代码如下： import os import requests from bs4 import BeautifulSoup from urllib 阅读全文

posted @ 2025-11-23 15:58 许志安xza 阅读(10) 评论(0) 推荐(0)

2025年11月9日

102302122许志安作业2

摘要：第二次作业作业①: 1、爬取城市天气实验：要求：在中国气象网（http://www.weather.com.cn）给定城市集的7日天气预报，并保存在数据库。 – 输出信息: 代码： import requests from bs4 import BeautifulSoup import sqli 阅读全文

posted @ 2025-11-09 12:00 许志安xza 阅读(108) 评论(0) 推荐(0)

2025年10月26日

102302122许志安作业1

摘要：作业1 （1）爬取大学排名信息实验 import requests from bs4 import BeautifulSoup url = "http://www.shanghairanking.cn/rankings/bcur/2020" res = requests.get(url) res.e 阅读全文

posted @ 2025-10-26 12:51 许志安xza 阅读(9) 评论(0) 推荐(0)

xxza06

公告