摘要: 一般的的静态HTML页面可以使用requests等库直接抓取,但还有一部分比较复杂的动态页面,这些页面的DOM是动态生成的,有些还需要用户与其点击互动,这些页面只能使用真实的浏览器引擎动态解析,Selenium和Chrome Headless可以很好的达到这种目的。 Headless Chrome 阅读全文
posted @ 2019-01-04 17:16 再见紫罗兰 阅读(12426) 评论(1) 推荐(2) 编辑