2022 年 12月 10 日随笔档案 - stone_wei

2022年12月10日

摘要：前面基本将爬虫的基础知识学习得差不多了，今天最后深入下requests模块，这个写完之后，一般的网站大家都可以去爬取了，后面会慢慢给大家分享一些烧脑的东西，今天还是先说说requests模块。思考问题1：如果一个网站需要账号密码登录后才能获得自己想要的东西，这个时候怎么进行爬取呢？答案分享：如果阅读全文

posted @ 2022-12-10 21:51 stone_wei 阅读(67) 评论(0) 推荐(0)

006爬虫之xpath获取猪八戒网商家信息

摘要：今天来学习一个之后会一直用到的解析方式：xpath，这个是重点，必须会。首先我们需要安装lxml模块： pip install lxml 用法： 1、将要解析的html内容构造出etree对象； 2、使用etree对象的xpath()方法配合xpath表达式来完成对数据的提取。我们先来看看xpa 阅读全文

posted @ 2022-12-10 15:38 stone_wei 阅读(293) 评论(0) 推荐(0)