会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
san-sheng
博客园
首页
新随笔
联系
订阅
管理
2026年1月16日
BeautifulSoup-cnblog
摘要: BeautifulSoup 蔬菜网 (完整代码再文后) 首先再基础的部分,和re正则不同的是,我们要先对拿到的网页源代码进行解析。 接着我们观察一下源代码,这里我们要爬的是网页中蔬菜的价格。 我们可以发现所有的价格品类等信息都在table标签下面,我们可以用beautifulsoup
阅读全文
posted @ 2026-01-16 21:12 san_sheng
阅读(2)
评论(0)
推荐(0)
2026年1月15日
豆瓣top250爬取-cnblog
摘要: 豆瓣top250爬取 (文末有完整代码) 这是我做的第一个项目,对于初学者来说我觉得这个项目还是很好入手的,首先导入库并且设置好url和请求头 然后我们打开网址和开发者工具,找到我们想要查找的具体的单元,因为接下来我们要从中提取数据找到对应的页面源代码。 用惰性匹配对变化的部分进行替换,用(
阅读全文
posted @ 2026-01-15 17:16 san_sheng
阅读(5)
评论(0)
推荐(0)
2026年1月11日
爬虫幼儿园的第一周-cnblog
摘要: 爬虫幼儿园的第一周 这一周从0开始学爬虫,到找到实习,老己辛苦啦,汇总一下学习成果,再复盘一下面试 写在正文的前面 爬虫主要分为两部分获取页面和筛选出想要的内容,网页内容主要分为服务器渲染和客户端渲染。 前者数据在服务器打包好,数据直接在html中,交由浏览器解析。 后者则会通过几次不同的请求,
阅读全文
posted @ 2026-01-11 00:59 san_sheng
阅读(8)
评论(0)
推荐(0)
2025年12月26日
python-django第一天(到处挖坑版)
摘要: 从0开始记录一下自己的学习过程, 开始这个模块其实比较偶然,刚好有一个相关的项目,刚好最近空就想尝试一下,但是迫于时间的问题最终还是失败了 记录一下今天学到的东西,但中间有部分依靠ai的比较多,接下来几天打算回头从基础开始,所以这个坑可能会弃一段时间,但我生耶我一定会回来补上的 1、开始在先建好的d
阅读全文
posted @ 2025-12-26 01:19 san_sheng
阅读(3)
评论(0)
推荐(0)
公告