随笔分类 - selenium
摘要:既然使用了selenium,那么必然牺牲了一些速度上的优势,但由于公司网速不稳定,导致频频出现加载报错,这才意识到selenium等待的重要性。 说到等待又可以分为3类, 1.强制等待 但是有一个问题,既然已知网速不稳定,那这个sleep的秒数如何确定,难道sleep max(最差的网络状态),显得
阅读全文
摘要:这几天的任务量比较大,还有一个挺棘手的网站cfda,不巧的是数据量还挺大,40W关于企业信息。上来就是debugger pause,调试中断,开始还是挺懵逼的,但这个还算简单毕竟google,百度,就能解决。经过初步的分析,有一个难点,关于跨网页,一个字串,以及cookies是一个网页一变,要解决这
阅读全文
摘要:简单的小栗子。 其中蛮有趣的一种输入方式 参考自http://selenium-python.readthedocs.io/getting-started.html官方文档。
阅读全文
摘要:前言:由于登录反爬措施的越来越麻烦,甚至出现了12306这种看图识物的无敌验证码,我只能说,我选择死亡。这就衍生出了使用selenium来获取获取cookies。 实例:获取qq空间cookies,亲测成功2018-3-7(注意点:chromedriver.exe的路径输入) cookies一保存,
阅读全文
摘要:1.1什么是selenium selenium可以模拟真实浏览器,自动化测试工具,支持多种浏览器,爬虫中主要用来解决JavaScript渲染问题、通过账号密码获取cookies(基于各大网站登录验证码的升级,特别是12306)。 1.2centos7无桌面环境部署 安装火狐浏览器 $ yum ins
阅读全文

浙公网安备 33010602011771号