王光诚 - 博客园

2025年12月30日

摘要：实践系统与小组成员介绍项目信息内容描述课程 2025数据采集与融合技术组名、项目简介组名：基米大哈气项目背景：针对B站视频评论信息量大、内容杂乱的问题，提供智能化的筛选与分类方案，帮助用户快速了解视频评论风向。项目目标：开发一个支持评论爬取、智能分类、违禁词管理及可视化分析的综合阅读全文

posted @ 2025-12-30 20:48 王光诚阅读(10) 评论(0) 推荐(0)

2025年12月2日

102302112王光诚作业4

摘要：作业①: 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。点击查看代码 import time import pymysql f 阅读全文

posted @ 2025-12-02 18:57 王光诚阅读(26) 评论(0) 推荐(0)

2025年11月22日

102302112王光诚作业3

摘要：作业①: 要求：指定一个网站，爬取这个网站中的所有的所有图片，例如：中国气象网（http://www.weather.com.cn）。实现单线程和多线程的方式爬取。 –务必控制总页数（学号尾数2位）、总下载的图片数量（尾数后3位）等限制爬取的措施。点击查看代码 import os import t 阅读全文

posted @ 2025-11-22 01:02 王光诚阅读(15) 评论(0) 推荐(0)

2025年11月11日

102302112王光诚作业2

摘要：作业①: 要求：在中国气象网（http://www.weather.com.cn）给定城市集的7日天气预报，并保存在数据库。运行结果: 点击查看代码 import sqlite3 import requests from bs4 import BeautifulSoup from datetime 阅读全文

posted @ 2025-11-11 21:06 王光诚阅读(32) 评论(0) 推荐(0)

2025年10月27日

102302112王光诚作业1

摘要：点击查看代码 import requests from bs4 import BeautifulSoup import matplotlib.pyplot as plt import re # 图片尺寸 FIG_SIZE = (16, 12) # 图片清晰度 DPI = 300 # 图片保存路径 S 阅读全文

posted @ 2025-10-27 21:03 王光诚阅读(29) 评论(0) 推荐(0)

wangguangcheng

公告