step1

  • 准备工作:

Chrome浏览器插件

  1,安装步骤

    1,右上角 - 更多工具 - 扩展程序

2,点开右上角 - 开发者模式

3,把插件 拖拽到 浏览器页面 释放鼠标 点击 添加拓展 ...

  2,插件介绍

    1,Proxy SwitchOmega:代理插件

2,Xpath Helper:网页数据解析插件

3,JSON View:查看JSON格式的数据(好看)

Fiddler抓包工具

  1,抓包设置

    1,Tools > options > HTTPS > ... > from browsers only

2,Connnections :设置端口号8888(默认)

  2,设置浏览器的代理

    Proxy SwitchOmega > 选项 > 新建情景模式 > HTTP 127.0.0.1 8888 > 应用选项

  • 爬取数据的步骤:

  1,确定需要爬取的URL地址

  2,通过HTTP/HTTPS协议来获取相应的HTML页面

  3,提取页面有用的数据

    1,所需数据,保存

    2,页面中有其他的URL,继续第2步

 

posted @ 2020-03-23 12:40  风中劲草18  阅读(534)  评论(0编辑  收藏  举报