摘要: from:https://www.cnblogs.com/ospider/p/5911339.html 最近要做下微信爬虫,之前写个小东西都是直接用正则提取数据就算了,如果需要更稳定的提取数据,还是使用 xpath 定位元素比较可靠。周末没事,从爬虫的角度研究了一下 python xml 相关的库。 阅读全文
posted @ 2018-02-19 14:20 公众号python学习开发 阅读(2790) 评论(0) 推荐(0) 编辑
摘要: <div> <a href="xxxx">123</a> <a href="xxxx">45</a><div> <div> 123 45<div> 请问使用lxml的etree,etree.xpath 怎么一种方式获取内容 div里的12345? 方案2.etree改用document_fromst 阅读全文
posted @ 2018-02-19 13:30 公众号python学习开发 阅读(247) 评论(0) 推荐(0) 编辑