pandas入门(5)

JSON数据

JSON数据已经成为通过HTTP请求在Web浏览器和其他应用程序之间发送数据的标准格式之一。除其空值null和一些其他的细微差别,JSON非常接近有效的Python代码。基本类型有对象(字典),数组(列表),字符串,数值,布尔值以及null。对象中所有键必须是字符串。通过json库,json.loads可以将JSON字符串转换为Python格式。相反json.dumps将Python对象转换成JSON格式。

XML和HTML:Web信息收集

可以利用lxml获取信息。首先找到希望获取数据的url,利用urllib2打开,在用lxml解析得到的数据流。

 

posted on 2016-11-01 19:11  Minstrel  阅读(120)  评论(0)    收藏  举报