摘要: 最近遇到个需求,需要爬一些数据使用,写好了爬虫后爬到了一段HTML,然后用lxml解析,接下来就是定位到具体节点提取内容。遇到了一个问题,想要提取的内容在一个class名为full-content的<div>中,文本内容有可能就在div中,也有可能在子孙节点中,那怎么全部提取呢?查了一下Xpath有 阅读全文
posted @ 2018-06-09 09:58 lzp的bky 阅读(2022) 评论(0) 推荐(0) 编辑