yy71 - 博客园

2026年1月3日

摘要：这个项目属于哪个课程 2025数据采集与数据融合实践组名、项目简介组名：暴虎项目简介：基于京东多智能体挑战赛，依托 OxyGent 开源框架，构建多智能体系统，实现多模态数据采集、智能任务分发与协同推理，完成赛事多级别、多类型任务，生成符合要求的提交结果。团队成员学号 102302117（冯阅读全文

posted @ 2026-01-03 20:49 yy71 阅读(20) 评论(0) 推荐(0)

2025年12月7日

数据采集第四次作业

摘要：作业①: 要求：熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。候选网站：东方财富网：http://quote.eastmone 阅读全文

posted @ 2025-12-07 15:38 yy71 阅读(13) 评论(0) 推荐(0)

2025年11月24日

数据采集第三次作业

摘要：作业①: 要求：指定一个网站，爬取这个网站中的所有的所有图片，例如：中国气象网（http://www.weather.com.cn）。实现单线程和多线程的方式爬取。点击查看代码 import requests from bs4 import BeautifulSoup import os impo 阅读全文

posted @ 2025-11-24 22:45 yy71 阅读(24) 评论(0) 推荐(0)

2025年11月2日

数据采集第二次作业

摘要： 1.作业①: 要求：在中国气象网（http://www.weather.com.cn）给定城市集的7日天气预报，并保存在数据库。点击查看代码 import requests from bs4 import BeautifulSoup import re import sqlite3 import 阅读全文

posted @ 2025-11-02 14:09 yy71 阅读(51) 评论(0) 推荐(0)

2025年10月21日

数据采集第一次作业

摘要： 1. 作业①: 要求：用requests和BeautifulSoup库方法定向爬取给定网址（http://www.shanghairanking.cn/rankings/bcur/2020）的数据，屏幕打印爬取的大学排名信息。点击查看代码 import urllib.request from b 阅读全文

posted @ 2025-10-21 00:36 yy71 阅读(33) 评论(0) 推荐(0)