2018年8月21日

python--web crawler-iii

摘要: requests 库是一个阻塞式HTTP请求库,当我们发出一个请求后,程序会一直等待服务器响应,直到得到响应后,程序才会进行下一步处理。 aiohttp可以提供异步web服务的库,在等待过程中做一些其他事情,如请求的调度、响应的处理 JavaScript 使得用户与信息之间不只是一种浏览与显示的关系 阅读全文

posted @ 2018-08-21 23:49 fortwater 阅读(103) 评论(0) 推荐(0)

python--web crawler-II

摘要: 使用Chrome or Firefox 进行网页抓取,不足之处,程序运行过程中需要一直开着浏览器。 方法一:目前,最新的Chrome支持无界面模式。 方法二:安装无界面浏览器PhantomJS,此时抓取过程在后台运行,不会有窗口出现。 selenium 是一个自动化测试工具,利用它我们可以驱动浏览器 阅读全文

posted @ 2018-08-21 00:18 fortwater 阅读(115) 评论(0) 推荐(0)

导航