随笔分类 -  Python

摘要:使用Re模块首先生成一个匹配模式pattern,如pattern=‘.test’然后使用re.match(pattern,str)或者search()匹配调用match跟search的区别:match()函数试图从字符串的起始部分对模式进行匹配。如果匹配成功救返回一个匹配对象;如果匹配失败,就返回N... 阅读全文
posted @ 2017-05-14 17:05 vspiders 阅读(166) 评论(0) 推荐(0)
摘要:首先从程序入口开始分析,在程序入口处传入一个待爬取的网址,使用下载器Html_downloader类下载该地址的内容,使用解释器 parser分析内容,利用BeautifulSoup包抓取想要爬取的内容和地址, 把地址增加到Url_Manager管理器中,同时把抓取的内容收集起 来。... 阅读全文
posted @ 2016-01-06 10:13 vspiders 阅读(254) 评论(0) 推荐(0)