pandas入门(5)
JSON数据
JSON数据已经成为通过HTTP请求在Web浏览器和其他应用程序之间发送数据的标准格式之一。除其空值null和一些其他的细微差别,JSON非常接近有效的Python代码。基本类型有对象(字典),数组(列表),字符串,数值,布尔值以及null。对象中所有键必须是字符串。通过json库,json.loads可以将JSON字符串转换为Python格式。相反json.dumps将Python对象转换成JSON格式。
XML和HTML:Web信息收集
可以利用lxml获取信息。首先找到希望获取数据的url,利用urllib2打开,在用lxml解析得到的数据流。