摘要:
Python抓取页面中超链接(URL)的3中方法比较(HTMLParser、pyquery、正则表达式)HTMLParser版:#!/usr/bin/python # -*- coding: UTF-8 -*- import HTMLParserclass UrlParser(HTMLParser.HTMLParser): def__init__(self): HTMLParser.HTMLParser.__init__(self) self.urls = [] def handle_starttag(self, tag, attrs): if tag == 'a': for 阅读全文
posted @ 2013-11-24 01:48
DemonSpider
阅读(1481)
评论(0)
推荐(0)
浙公网安备 33010602011771号