xpath表达式,提取标签下的全部内容(将其他标签过滤)


例如要提取span下的内容
//div[@class="content"]/span

正确的其中一种写法如下
data = response.xpath('//div[@class="content"]/span[descendant-or-self::text()]')
it['content'] = data.xpath('string(.)').extract()


【转】xpath基本语法http://www.cnblogs.com/zhaozhan/archive/2009/09/09/1563617.html



posted @ 2016-11-14 11:56  宝山方圆  阅读(11700)  评论(0编辑  收藏  举报