摘要: BeautifulSoup 已经是非常强大的库了,不过还有一些比较流行的解析库,例如 lxml,使用的是 Xpath 语法,同样是效率比较高的解析方法。 1.安装 pip install lxml 2. XPath语法 XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 阅读全文
posted @ 2018-11-20 18:27 暮良文王 阅读(2974) 评论(1) 推荐(0)
摘要: Selenium--浏览器上的按键精灵 Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,类型像我们玩游戏用的按键精灵,可以按指定的命令自动操作,不同是Selenium 可以直接运行在浏览器上,它支持所有主流的浏览器(包括无界面的浏览器)。 Selenium 可以根据我们 阅读全文
posted @ 2018-11-20 18:17 暮良文王 阅读(551) 评论(0) 推荐(0)
摘要: 在使用PhantomJS时候,出现提示: 意思是说:新版本的Selenium不再支持PhantomJS了,请使用Chrome或Firefox的无头版本来替代。 问完谷歌,发现原来是PhantomJS开发者内部矛盾,并且Firefox和Chrome都带了无头模式带来的打压,最终宣布终止开发。可以说结局 阅读全文
posted @ 2018-11-20 15:07 暮良文王 阅读(11216) 评论(0) 推荐(1)