摘要: 【综合实践】基于 DrissionPage 的小红书高性能数据采集 1. 项目背景与意义 在当今的数字时代,人们的旅行灵感高度依赖于社交媒体平台。用户在浏览小红书、抖音等平台时,收集了大量碎片化的种草信息,但从灵感到可行的行程规划之间存在巨大的鸿沟 。 为了解决这一痛点,我们团队开发了 “途知:智能 阅读全文
posted @ 2025-12-19 19:14 abc。 阅读(8) 评论(0) 推荐(0)
摘要: 作业① 气象爬取 实验要求 要求:指定一个网站,爬取这个网站中的所有的所有图片,例如中国气象网(http://www.weather.com.cn)。实现单线程和多线程的方式爬取。 核心代码和运行结果 点击查看代码 import os import requests from bs4 import 阅读全文
posted @ 2025-12-06 14:50 abc。 阅读(7) 评论(0) 推荐(0)
摘要: 作业① 股票爬取 实验要求 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 核心代码和运行结果 点击查看代码 import pymysql import time from selenium import webdrive 阅读全文
posted @ 2025-11-30 11:51 abc。 阅读(17) 评论(0) 推荐(0)
摘要: 作业① 气象爬取 实验要求 在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库。 核心代码和运行结果 点击查看代码 from bs4 import BeautifulSoup from bs4 import UnicodeDammit impo 阅读全文
posted @ 2025-10-31 16:51 abc。 阅读(20) 评论(0) 推荐(0)
摘要: 作业① 1.大学排名爬取 要求 用requests和BeautifulSoup库方法定向爬取给定网址(http://www.shanghairanking.cn/rankings/bcur/2020 )的数据,屏幕打印爬取的大学排名信息。 排名 学校名称 省市 学校类型 总分 1 清华大学 北京 综 阅读全文
posted @ 2025-10-18 20:36 abc。 阅读(7) 评论(0) 推荐(0)