随笔分类 - Python
摘要:使用Re模块首先生成一个匹配模式pattern,如pattern=‘.test’然后使用re.match(pattern,str)或者search()匹配调用match跟search的区别:match()函数试图从字符串的起始部分对模式进行匹配。如果匹配成功救返回一个匹配对象;如果匹配失败,就返回N...
阅读全文
摘要:首先从程序入口开始分析,在程序入口处传入一个待爬取的网址,使用下载器Html_downloader类下载该地址的内容,使用解释器 parser分析内容,利用BeautifulSoup包抓取想要爬取的内容和地址, 把地址增加到Url_Manager管理器中,同时把抓取的内容收集起 来。...
阅读全文

浙公网安备 33010602011771号