喵吉欧尼酱

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

css选择器:

 

excract_first  如果数组为空会抛出异常 用了这个函数之后,就不存在异常,如果提取不到就为空

 

 

 


提取出 标题:

======================================================================

:: 是css固定用法 用来提取内容

response.css('.entry-header h1::text').extract()[0]

 

>>> response.css('p.entry-meta-hide-on-mobile::text').extract()[0]
'\r\n\r\n            2017/02/18 ·  '
>>> response.css('p.entry-meta-hide-on-mobile::text').extract()[0].strip()
'2017/02/18 ·'
>>> response.css('p.entry-meta-hide-on-mobile::text').extract()[0].strip().replace('·', ' ')
'2017/02/18  '

 

 

>>> response.css('.vote-post-up h10::text').extract()
['2']

response.css('a[href="#article-comment"] span::text').extract()[0]
' 7 评论'

完整代码

 

 

posted on 2017-10-08 20:27  喵吉欧尼酱  阅读(1240)  评论(0)    收藏  举报