学以致用

focus on Python , C++, and some interest in Go and R

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

采用lxml进行xml的解析操作,在使用find()和findall()方式进行操作的时候,如果match按照XPath标准写的复杂点儿,某些情况下会碰到invalid predicate错误。
从lxml的官方文档上来看,lxml是支持XPath1.0标准的,可为何还报出invalid predicate错误呢?
仔细查阅lxml文档才发现:
原来,lxml为了和python标准库中的xml.etree.ElementTree兼容,采用了和xml.etree.ElementTree同样的策略。xml.etree.ElementTree中的find和findall对XPath的支持本身就是有限的,只能算是支持了XPath的一个子集。lxml对XPath的支持体现在xpath()方法中,如果不考虑兼容性的问题,全部采用xpath()来操作即可

参阅:
http://lxml.de/FAQ.html#what-are-the-findall-and-xpath-methods-on-element-tree

http://stackoverflow.com/questions/6218126/xpath-predicate-with-sub-paths-with-lxml

posted on 2012-06-02 15:58  Jerry.Kwan  阅读(2062)  评论(0编辑  收藏  举报