寒假学习记录11_python学习2
我学习的是使用python通过selenium对网页进行爬取。
Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。这个工具的主要功能包括:测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求。支持自动录制动作和自动生成 .Net、Java、Perl等不同语言的测试脚本。
Selenium 的自动化原理是这样的:我们编写好程序,通过浏览器驱动可以对浏览器进行自动化操作,进而爬取到我们需要的信息。Selenium提供了多种编程语言的Selenium客户端库,包括 java,python,js,ruby等,方便不同编程语言的开发者使用。我们只需要安装好客户端库,调用这些库,就可以发出自动化请求给浏览器了。就像是用户在操作一样。
浏览器驱动是一个由浏览器厂商提供的独立的程序,它会接收我们发动的操作请求,进而让浏览器去执行对应的自动化操作。
我做了如下准备:
①我已经有了python编译环境不用动了。
②通过pip安装selenium
pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple/
③安装浏览器驱动
我使用的是谷歌浏览器,因此安装了chromedriver.exe
至此就完成了环境的搭建。
浙公网安备 33010602011771号