tomcat
NUTCH安装
http://blog.csdn.net/zjzcl/archive/2006/02/01/590537.aspx
http://blog.csdn.net/zjzcl/archive/2006/02/06/593138.aspx
Nutch搜索技术相关的资料.oO |
|
┌───────────────────────── │Nutch相关的资料 - 中文处理 (05年06月17日开始收集) └─────────────────────────
http://issues.apache.org/jira/browse/NUTCH-36 http://www.mail-archive.com/nutch-developers@lists.sourceforge.net/msg03907.html
以上两个链接的内容出处相同,都是Apache Nutch dev mail archive。 由Jack Tang于04-Apr-2005提出,是描述在Nutch搜索中加入中文支持的技术。 因为刚刚提出,没有成熟,需要探索才能使用,有点挑战!希望早日搞定!
┌───────────────────────── │Nutch相关的资料 - Apache (05年06月14日开始收集) └─────────────────────────
Nutch JavaDoc Overview (Nutch 0.6 API) Nutch的Java代码文档。
Nutch Mailing Lists Nutch的邮件列表。
Nutch - Tutorial Nutch的教程。(入门必读!)
Nutch Wiki - Dissecting The Nutch Crawler Nutch维基:分解Nutch爬虫。(有相当详尽的资料,值得研读!)
Nutch Wiki - Distributed Web DB Nutch维基:分布式网页数据库。
Nutch Wiki - Front Page Nutch维基:入口。
Nutch Wiki - Nutch Distributed File System Nutch维基:Nutch分布式文件系统。
Nutch Wiki - Nutch File Formats Nutch维基:Nutch文件格式。
Nutch Wiki - Web DB Nutch维基:Nutch文件系统。(旧的版本!)
Nutch Wiki - Why Nutch Has A Plugin System Nutch维基:讲述Nutch的插件系统,可惜不全。
┌───────────────────────── │Nutch相关的资料 - Online (05年06月08日开始收集) └─────────────────────────
Nutch Documentation This is not the offical nutch wiki, but some private collected documentation!!! By Stefan Groschupf.
未知都是已知的 - Fenng's BLOG Nutch 初体验之一 什么是 Nutch ? Nutch 和 Larbin / Lucene 相比较有什么不同? 测试笔记。
未知都是已知的 - Fenng's BLOG Nutch 初体验之二 介绍一下 Nutch 进行全网的爬行(Whole-web Crawling) 的操作测试过程以及注意事项。
竹笋炒肉 - 试用Nutch 是作者对nutch的一些试用记录。作者认为,搭建网站时实现本站检索的最好的方案,是采用车东基于lucene的开源项目web lucene的软件包。而nutch似乎比较适合于建立垂直搜索引擎网站。
Nutch - A Flexible and Scalable Open-Source Web Search Engine (PDF File,是一篇Doug Cutting参与的描述Nutch的论文。)
Nutch - Open Source Web Search Software (PDF File,是一篇Doug Cutting的introduce Nutch的power point file。)
http://www.mail-archive.com/nutch-developers@lists.sourceforge.net/msg03641.html 关于“International Parser”,Doug Cutting replied to this thread.
http://www.opensubscriber.com/message/nutch-developers@lists.sourceforge.net/1436319.html 关于Myanmar language analyzer。
SatireWire Vearch - Vertical Search Engines Known as "vearch" engines, these new players provide unprecedented speed and relevancy by cataloging a narrow selection of sites...
|
天地任我行。。。
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=694497