以Webdriver实例了解Webdriver

Webdriver是一个自动化测试软件，也是处理Ajax渲染之一的爬虫工具。

本文以一个实际案例(今日头条的阳光宽频(365yg.com))来了解它有什么作用，它能做什么。相关的爬取思路也可应用在其他相类似的网站。

分析思路

第1步:首先进入https://365yg.com确定爬取的目标，本例爬取视频的下载链接、视频标题和作者

第2步:单击鼠标右键选择检查或按键盘F12调出谷歌浏览器抓包工具进行分析

多次查看不同的视频内容发现它们的视频超链接、视频标题和作者的网页结构完全一样，没有反爬点，无需其他的处理

第3步:单击鼠标右键选择查看网页源代码查看是否被Ajax渲染

3.1从搜索结果上看该网页很有可能已被Ajax渲染，但是仔细看发现下面这个区域有些关键字与我们需要的内容很相似，而且相关内容带有\u****等字样，有可能是将返回的中文转化为Unicode！！

3.2复制部分内容进行验证后发现尽管标题的内容与我们查找的标题不一样，但可确定的是首页没有被Ajax渲染，请求返回的视频标题、作者等信息会动态改变。

第4步:截止目前已解决爬取视频标题和作者、接下来着手视频的下载链接，接下来主要重复上面第1、第2、第3步

在浏览器中复制第2步获取到的a标签的链接并进入，使用与第2步相同的方式调取谷歌浏览器抓包工具进行分析，复制video标签中的src属性值的链接http://v3-default.ixigua.com/b4163b403a3374cbd32c3493907d4f79/5cfcf33b/video/m/并用浏览器打开

如图所示视频已加载出来，也就是说这个链接就是我们要找的视频下载链接！！

第5步:别高兴得太早，仔细想一下头条的反爬就这么容易被攻破吗？以第3步相同的方式查看该网页的网页源代码，并在页面查找video标签中的src属性值的链接http://v3-default.ixigua.com/b4163b403a3374cbd32c3493907d4f79/5cfcf33b/video/m/, 并没有查找到内容，而且也无带有\u****等字样相关内容。