san_sheng - 博客园

2026年1月16日

摘要： BeautifulSoup 蔬菜网（完整代码再文后）首先再基础的部分，和re正则不同的是，我们要先对拿到的网页源代码进行解析。接着我们观察一下源代码，这里我们要爬的是网页中蔬菜的价格。我们可以发现所有的价格品类等信息都在table标签下面，我们可以用beautifulsoup 阅读全文

posted @ 2026-01-16 21:12 san_sheng 阅读(2) 评论(0) 推荐(0)

2026年1月15日

豆瓣top250爬取-cnblog

摘要：豆瓣top250爬取（文末有完整代码）这是我做的第一个项目，对于初学者来说我觉得这个项目还是很好入手的，首先导入库并且设置好url和请求头然后我们打开网址和开发者工具，找到我们想要查找的具体的单元，因为接下来我们要从中提取数据找到对应的页面源代码。用惰性匹配对变化的部分进行替换，用（阅读全文

posted @ 2026-01-15 17:16 san_sheng 阅读(5) 评论(0) 推荐(0)

2026年1月11日

爬虫幼儿园的第一周-cnblog

摘要：爬虫幼儿园的第一周这一周从0开始学爬虫，到找到实习，老己辛苦啦，汇总一下学习成果，再复盘一下面试写在正文的前面爬虫主要分为两部分获取页面和筛选出想要的内容，网页内容主要分为服务器渲染和客户端渲染。前者数据在服务器打包好，数据直接在html中，交由浏览器解析。后者则会通过几次不同的请求，阅读全文

posted @ 2026-01-11 00:59 san_sheng 阅读(8) 评论(0) 推荐(0)

2025年12月26日

python-django第一天（到处挖坑版）

摘要：从0开始记录一下自己的学习过程，开始这个模块其实比较偶然，刚好有一个相关的项目，刚好最近空就想尝试一下，但是迫于时间的问题最终还是失败了记录一下今天学到的东西，但中间有部分依靠ai的比较多，接下来几天打算回头从基础开始，所以这个坑可能会弃一段时间，但我生耶我一定会回来补上的 1、开始在先建好的d 阅读全文

posted @ 2025-12-26 01:19 san_sheng 阅读(3) 评论(0) 推荐(0)

san-sheng

公告