上一页 1 ··· 12 13 14 15 16
摘要:目录 Apache Nutch 1.3 学习笔记一 Apache Nutch 1.3 学习笔记二 Apache Nutch 1.3 学习笔记三(Inject) Apache Nutch 1.3 学习笔记三( Inject CrawlDB Reader) Apache Nutch 1.3 学习笔记四(Generate) Apache Nutch 1.3 学习笔记四(SegmentReader分析) Apache Nutch 1.3 学习笔记五(FetchThread) Apache Nutch 1.3 学习笔记五(Fetcher流程) Apache Nutch 1.3 学习笔记六(ParseSe 阅读全文
posted @ 2011-10-22 21:45 爱开卷360 阅读 (1062) 评论 (0) 编辑
摘要:在尝试保护你的应用时,你是否有过挫败感?是否觉得现有的Java安全解决方案难以使用,只会让你更糊涂?本文介绍的Apache Shiro,是一个不同寻常的Java安全框架,为保护应用提供了简单而强大的方法。本文还解释了Apache Shiro的项目目标、架构理念以及如何使用Shiro为应用安全保驾护航。什么是Apache Shiro?Apache Shiro(发音为“shee-roh”,日语“堡垒(Castle)”的意思)是一个强大易用的Java安全框架,提供了认证、授权、加密和会话管理功能,可为任何应用提供安全保障 - 从命令行应用、移动应用到大型网络及企业应用。Shiro为解决下列问题(.. 阅读全文
posted @ 2011-10-19 15:05 爱开卷360 阅读 (3184) 评论 (0) 编辑
摘要:Lucene3.0之结果排序(原理篇)传统上,人们将信息检索系统返回结果的排序称为"相关排序"(relevance ranking),隐含其中各条目的顺序反映结果和查询的相关程度。 1、基本排序原理①向量空间模型Gerald Salton等在30多年前提出的"向量空间模型"(Vector Space Model,VSM)[Salton and Lesk,1968, Salton,1971]。该模型的基础是如下假设:文档d和查询q的相关性可以由它们包含的共有词汇情况来刻画。 经典的TF*IDF词项权重的计算公式: 给定某种权重的定量设计,求文档和查询的相关 阅读全文
posted @ 2011-10-19 14:37 爱开卷360 阅读 (7144) 评论 (0) 编辑
摘要:有关Lucene的Payload的相关内容,可以参考如下链接,介绍的非常详细,值得参考:http://www.ibm.com/developerworks/cn/opensource/os-cn-lucene-pl/http://www.lucidimagination.com/blog/2009/08/05/getting-started-with-payloads/ 例如,有这样的一个需求:现在有两篇文档内容非常相似,如下所示:文档1:egg tomato potato bread 文档2:egg book potato bread 现在我想要查询食物(foods),而且是查询关键词是.. 阅读全文
posted @ 2011-10-19 13:29 爱开卷360 阅读 (1259) 评论 (1) 编辑
摘要:介绍:Apache Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,也是目前最为流行的基于 Java 开源全文检索工具包。 第一部分:概述我们在很多地方都可以看到搜索功能Windows系统中的有搜索功能:打开"我的电脑",按"F3"就可以使用查找的功能,查找指定的文件或文件夹。搜索的范围是整个电脑中的文件资源。Eclipse中的帮助子系统:点击HelpàHelp Contents,可以查找出相关的帮助信息。搜索的 阅读全文
posted @ 2011-10-18 16:33 爱开卷360 阅读 (7709) 评论 (2) 编辑
上一页 1 ··· 12 13 14 15 16