五杀摇滚小拉夫

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

1.extract():提取数据

2./text()     :获取节点内容文本

3./@href   :获取节点href属性

4. @         :获取属性名称

 

需要注意问题:

用定义的规则那所有符合要求的节点获取下来,返回的类型是列表类型。

但是如果节点只有一个就会出现错误:

大多数情况下,想要的是第一个元素的内容,通过索引获取,但是如果得到的是一个空列表就会造成数组越界。

提取单个元素: 用 .extract_first() 就不会出现数组越界的问题。

 

posted on 2018-08-27 14:56  五杀摇滚小拉夫  阅读(110)  评论(0编辑  收藏  举报