摘要: python 之 爬虫数据采集 爬虫爬取数据的第一步必须分析目标网站的技术以及网站数据结构(通过前端源码),可借助chrome浏览器,目前python爬虫主要会面对一下三种网站: 前后端分离网站 前端通过传递参数访问接口,后端返回json数据,对于此类网站,python可模拟浏览器前端,发送参数然后 阅读全文
posted @ 2022-04-01 11:54 Ivan丶ky 阅读(779) 评论(0) 推荐(1)
摘要: Python 之 数据抓取三种方法 正则表达式(re库) BeautifulSoup(bs4) lxml 利用之前构建的下载网页函数,获取目标网页的html。 例子 我们以https://guojiadiqu.bmcx.com/AFG__guojiayudiqu/为例,获取html。 from ge 阅读全文
posted @ 2022-04-01 11:40 Ivan丶ky 阅读(539) 评论(0) 推荐(0)