随笔分类 -  全文搜索

摘要:转自http://blog.itpub.net/8912125/viewspace-1120496/ 阅读全文
posted @ 2015-01-30 08:46 猪哥哥厉害 阅读(1557) 评论(0) 推荐(0)
摘要:转载自 http://www.cnblogs.com/edwinchen/p/3973951.html 阅读全文
posted @ 2015-01-27 16:29 猪哥哥厉害 阅读(265) 评论(0) 推荐(0)
摘要:这里面用的是比较新的Lucene4.10.2 做的一个实例。(lucene的索引不能太大,要不然效率会很低。大于1G的时候就必须考虑分布索引的问题) 先介绍一下Lucene的几个参数意义: IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加入索引,同时控制索引过程中的一些参 阅读全文
posted @ 2015-01-26 14:49 猪哥哥厉害 阅读(995) 评论(0) 推荐(0)
摘要:检索技术基本原理: 最主要的两点是 1、如何创建索引 2、如何查询。 分析需求: 好几篇文档,从这些文档找关键词,一种方式是顺序一个个遍历,加入这些文档量很多,就花费太长时间了,第二种是建立索引,首先,通过要对文档操作,例如去除标签符合,停词,对词进行转换,例如cars 变为car ,driving 阅读全文
posted @ 2015-01-23 17:31 猪哥哥厉害 阅读(1970) 评论(0) 推荐(0)