程序猿刚子的博客

大龄程序猿,分享互联网开发相关知识!前端、后端,架构等内容,欢迎关注公众号 chengxuyuangangzi

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

使用python,喜欢她的简洁是一方面,另外就是它有着丰富的开发包 好用又方便 接下来会给大家推荐一系列很赞的开发包。


在解析html、xml过程中,我们有不少的包可以用。比如bs、lxml、xmltodict等 如果说你想立即上手,那么pyquery必然是最佳之选。


从名字上就可以看出,她一定和jQuery有着一定的关系

 

在官方网站上就是这样描述它的

pyquery: a jquery-like library for python


没错,作者就是将html、xml的解析接口封装成了类似jQuery的方法


赶快看看如何应用吧


官网:http://pythonhosted.org/pyquery/#

安装:pip install pyquery


来个实例开始吧

pyquery接受多种输入:字符串、etree对象、url及filename对象,这还不是重点,看下面列子

 

细心的朋友可以看到,我们在输入的xml字符串中并不是标准的xml格式,标签不匹配。


但是pq依然可以正常处理,对于一些经常想小爬网页的朋友简直了~ 很赞吧


好了,更多方法大家可以到官网看文档尝试http://pythonhosted.org/pyquery/#


今天的推荐就到这里啦, 下期有更精彩的开发包推荐


欢迎关注公众号”人生苦短我用Python“


posted on 2015-11-12 23:40  程序猿刚子  阅读(1600)  评论(0编辑  收藏  举报