ChristianK

笨鸟先飞,笨猪先肥

2010年5月21日

尝试控制Lucene索引编辑过程中的CPU占用

摘要: 使用Lucene过程中一直以来比较痛苦的一件事就是在它执行Optimize方法是会霸占系统大量资源(说“独占”都不为过),一个29万条数据,4G+的索引,在我的笔记本上Optimize的时间长达32分钟,这期间我几乎只能去台式机上干活。很遗憾的是起码它开放的API我还没找到控制CPU占用的方法,事实上,想象中也比较困难,因为写入磁盘IO的事情,可是计算的动作就是要消耗CPU... 阅读全文

posted @ 2010-05-21 12:59 闻滨 阅读(481) 评论(0) 推荐(0)
Lucene.net索引实时更新

摘要: 在Apache的更新日志上看到这样一句话25 September 2009 - Lucene Java 2.9.0 availableThis release has many improvements since release 2.4.1, including: Near real-time search capabilities added to IndexWriter Oops…... 阅读全文

posted @ 2010-05-21 12:37 闻滨 阅读(813) 评论(0) 推荐(0)
换汤不换药的UpdateDocuments

摘要: 一直很好奇当初Apache曾经说的即将推出的UpdateDocuments()方法是个什么样的方法,Lucene索引的这种紧凑的文件结构如何能“允许”这个“Update”动作的发生呢? 千呼万唤始出来,不出所料,还是换汤不换药注释Code highlighting produced by Actipro CodeHighlighter (freewa... 阅读全文

posted @ 2010-05-21 12:19 闻滨 阅读(385) 评论(0) 推荐(0)