摘要: 一、网络爬虫的定义网络爬虫,即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页的。从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这... 阅读全文
posted @ 2014-06-01 16:07 Yahong 阅读(900) 评论(0) 推荐(0)
摘要: 在字符串模式匹配的学习中,对于没有学过的数据结构与算法的来讲,可能首先就会想起将模式字符串和目标字符串逐个去比较,直到匹配为止,这就学术上说的“朴素”算法,这算法的确可行,但是不高效,从而有了KMP的算法的出现,简单来讲KMP算法就是利用模式字符和匹配过程的已知条件得出一个值,去跳过在朴素算法逐个匹配过程中无必要的匹配,从而达到高效的算法。虽然这是简单的思路,但是KMP算法理解起来真的比较费劲,下面,我自己结合课件和网上各位大神的解释,总结写一下比较好懂的KMP算法解释。字符串模式匹配指的是,找出特定的模式串在一个较长的字符串中出现的位置。朴素的模式匹配算法(BF(Brute Force)算法 阅读全文
posted @ 2013-11-13 00:05 Yahong 阅读(4158) 评论(0) 推荐(0)