2022 年 4月 1 日随笔档案 - Ivan丶ky

2022年4月1日

摘要： python 之爬虫数据采集爬虫爬取数据的第一步必须分析目标网站的技术以及网站数据结构（通过前端源码），可借助chrome浏览器，目前python爬虫主要会面对一下三种网站：前后端分离网站前端通过传递参数访问接口，后端返回json数据，对于此类网站，python可模拟浏览器前端，发送参数然后阅读全文

posted @ 2022-04-01 11:54 Ivan丶ky 阅读(779) 评论(0) 推荐(1)

Python 之数据抓取三种方法

摘要： Python 之数据抓取三种方法正则表达式（re库） BeautifulSoup（bs4） lxml 利用之前构建的下载网页函数，获取目标网页的html。例子我们以https://guojiadiqu.bmcx.com/AFG__guojiayudiqu/为例，获取html。 from ge 阅读全文

posted @ 2022-04-01 11:40 Ivan丶ky 阅读(539) 评论(0) 推荐(0)

Ivan丶c

公告