摘要:
python中,有三个库可以解析html文本,HTMLParser,sgmllib,htmllib。他们的实现方法不通,但功能差不多。这三个库中 提供解析html的类都是基类,本身并不做具体的工作。他们在发现的元件后(如标签、注释、声名等),会调用相应的函数,这些函数必须重载,因为基类中不 作处理。比如:"""<html><head><title>Advice</title></head><body><p>The <a href="http://ietf.org&q 阅读全文
posted @ 2013-05-29 18:10
fangFXQ
阅读(1040)
评论(0)
推荐(0)
浙公网安备 33010602011771号