摘要: 1、urllib模块 1.urllib.urlopen(url[,data[,proxies]]) 打开一个url的方法,返回一个文件对象,然后可以进行类似文件对象的操作。本例试着打开google urlopen返回对象提供方法: - read([bytes]):读所以字节或者bytes个字节 - 阅读全文
posted @ 2016-04-22 11:46 “人生苦短” 阅读(706) 评论(0) 推荐(0)
摘要: HTMLParser是Python自带的模块,使用简单,能够很容易的实现HTML文件的分析。本文主要简单讲一下HTMLParser的用法. 使用时需要定义一个从类HTMLParser继承的类,重定义函数: handle_starttag( tag, attrs) handle_startendtag 阅读全文
posted @ 2016-04-22 11:30 “人生苦短” 阅读(5262) 评论(0) 推荐(1)