会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
fp666
博客园
首页
新随笔
联系
订阅
管理
2025年12月30日
数据采集综合实践
摘要: 项目信息 内容描述 课程 2025数据采集与融合技术 组名、项目简介 组名: 基米大哈气 项目背景: 针对B站视频评论信息量大、内容杂乱的问题,提供智能化的筛选与分类方案,帮助用户快速了解视频评论风向。 项目目标: 开发一个支持评论爬取、智能分类、违禁词管理及可视化分析的综合系统,实现对评论内容的精
阅读全文
posted @ 2025-12-30 21:06 ygtr3ce
阅读(16)
评论(0)
推荐(0)
2025年12月10日
数据采集第四次作业
摘要: 作业1 要求: 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 候选网站:东方财富网:http://quote.eastmone
阅读全文
posted @ 2025-12-10 10:59 ygtr3ce
阅读(11)
评论(0)
推荐(0)
2025年11月25日
数据采集第三次作业
摘要: 作业1 相关代码与结果 代码 单线程代码如下: 点击查看代码 import requests from bs4 import BeautifulSoup import os import time import urllib.parse class WeatherImageDownloader: d
阅读全文
posted @ 2025-11-25 22:58 ygtr3ce
阅读(23)
评论(0)
推荐(0)
2025年11月11日
数据采集第二次作业
摘要: 作业1 相关代码和结果 点击查看代码 from bs4 import BeautifulSoup from bs4 import UnicodeDammit import urllib.request import sqlite3 class WeatherDatabase: def __init_
阅读全文
posted @ 2025-11-11 21:12 ygtr3ce
阅读(9)
评论(0)
推荐(0)
2025年10月27日
102302115方朴第一次作业
摘要: 102302115方朴第一次作业 任务1 代码及运行结果 import requests from bs4 import BeautifulSoup target_url = "http://www.shanghairanking.cn/rankings/bcur/2020" res = reque
阅读全文
posted @ 2025-10-27 19:44 ygtr3ce
阅读(11)
评论(0)
推荐(0)
公告