随笔分类 - 搜索引擎
搜索引擎的学习和开发
摘要:Sphinx在Windows下的安装(仅供小师弟们以后参考)Sphinx的中文参考:http://www.sphinxsearch.com/wiki/doku.php?id=sphinx_chinese_tutorial Sphinx是 一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现 专业化的全文检索...
阅读全文
摘要:WebSphinx,Jobo等爬虫的Http分析 看了一些开源的网络爬虫代码,把注意都集中在一些细节的设计模式上,感觉对整个系统的整体把握不够,于是打算花点时间好好分析一下各个爬虫对Http的处理。第一个问题就是如果去获取远程的网页,在Java里面可以采用下面的简单方式:1) 自己写代码,通过URL获取,代码如下:[代码]2. 利用HttpClient包进行相应的处理:(与上面的代码相比,Http...
阅读全文


浙公网安备 33010602011771号