摘要: BeautifulSoup ​ 蔬菜网 ​ (完整代码再文后) ​ 首先再基础的部分,和re正则不同的是,我们要先对拿到的网页源代码进行解析。 ​ 接着我们观察一下源代码,这里我们要爬的是网页中蔬菜的价格。 我们可以发现所有的价格品类等信息都在table标签下面,我们可以用beautifulsoup 阅读全文
posted @ 2026-01-16 21:12 san_sheng 阅读(2) 评论(0) 推荐(0)
摘要: 豆瓣top250爬取 ​ (文末有完整代码) ​ 这是我做的第一个项目,对于初学者来说我觉得这个项目还是很好入手的,首先导入库并且设置好url和请求头 然后我们打开网址和开发者工具,找到我们想要查找的具体的单元,因为接下来我们要从中提取数据找到对应的页面源代码。 用惰性匹配对变化的部分进行替换,用( 阅读全文
posted @ 2026-01-15 17:16 san_sheng 阅读(5) 评论(0) 推荐(0)
摘要: 爬虫幼儿园的第一周 ​ 这一周从0开始学爬虫,到找到实习,老己辛苦啦,汇总一下学习成果,再复盘一下面试 写在正文的前面 爬虫主要分为两部分获取页面和筛选出想要的内容,网页内容主要分为服务器渲染和客户端渲染。 前者数据在服务器打包好,数据直接在html中,交由浏览器解析。 后者则会通过几次不同的请求, 阅读全文
posted @ 2026-01-11 00:59 san_sheng 阅读(8) 评论(0) 推荐(0)
摘要: 从0开始记录一下自己的学习过程, 开始这个模块其实比较偶然,刚好有一个相关的项目,刚好最近空就想尝试一下,但是迫于时间的问题最终还是失败了 记录一下今天学到的东西,但中间有部分依靠ai的比较多,接下来几天打算回头从基础开始,所以这个坑可能会弃一段时间,但我生耶我一定会回来补上的 1、开始在先建好的d 阅读全文
posted @ 2025-12-26 01:19 san_sheng 阅读(3) 评论(0) 推荐(0)