会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
abcman12
博客园
首页
新随笔
联系
订阅
管理
2025年12月19日
小红书关键词爬取
摘要: 【综合实践】基于 DrissionPage 的小红书高性能数据采集 1. 项目背景与意义 在当今的数字时代,人们的旅行灵感高度依赖于社交媒体平台。用户在浏览小红书、抖音等平台时,收集了大量碎片化的种草信息,但从灵感到可行的行程规划之间存在巨大的鸿沟 。 为了解决这一痛点,我们团队开发了 “途知:智能
阅读全文
posted @ 2025-12-19 19:14 abc。
阅读(8)
评论(0)
推荐(0)
2025年12月6日
第三次作业102302127
摘要: 作业① 气象爬取 实验要求 要求:指定一个网站,爬取这个网站中的所有的所有图片,例如中国气象网(http://www.weather.com.cn)。实现单线程和多线程的方式爬取。 核心代码和运行结果 点击查看代码 import os import requests from bs4 import
阅读全文
posted @ 2025-12-06 14:50 abc。
阅读(7)
评论(0)
推荐(0)
2025年11月30日
第四次作业
摘要: 作业① 股票爬取 实验要求 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 核心代码和运行结果 点击查看代码 import pymysql import time from selenium import webdrive
阅读全文
posted @ 2025-11-30 11:51 abc。
阅读(17)
评论(0)
推荐(0)
2025年10月31日
第三次作业
摘要: 作业① 气象爬取 实验要求 在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库。 核心代码和运行结果 点击查看代码 from bs4 import BeautifulSoup from bs4 import UnicodeDammit impo
阅读全文
posted @ 2025-10-31 16:51 abc。
阅读(20)
评论(0)
推荐(0)
2025年10月18日
2023数据采集与融合技术作业一
摘要: 作业① 1.大学排名爬取 要求 用requests和BeautifulSoup库方法定向爬取给定网址(http://www.shanghairanking.cn/rankings/bcur/2020 )的数据,屏幕打印爬取的大学排名信息。 排名 学校名称 省市 学校类型 总分 1 清华大学 北京 综
阅读全文
posted @ 2025-10-18 20:36 abc。
阅读(7)
评论(0)
推荐(0)
公告