css选择器:
excract_first 如果数组为空会抛出异常 用了这个函数之后,就不存在异常,如果提取不到就为空



提取出 标题:

======================================================================
:: 是css固定用法 用来提取内容
response.css('.entry-header h1::text').extract()[0]

>>> response.css('p.entry-meta-hide-on-mobile::text').extract()[0] '\r\n\r\n 2017/02/18 · ' >>> response.css('p.entry-meta-hide-on-mobile::text').extract()[0].strip() '2017/02/18 ·' >>> response.css('p.entry-meta-hide-on-mobile::text').extract()[0].strip().replace('·', ' ') '2017/02/18 '

>>> response.css('.vote-post-up h10::text').extract() ['2']

response.css('a[href="#article-comment"] span::text').extract()[0] ' 7 评论'
完整代码


浙公网安备 33010602011771号