摘要:先明确一下各种格式文件的概念NameExtensionBrief DescriptionSegments Filesegments.gen, segments_NStores information about segmentsCompound File.cfsAn optional "virtual" file consisting of all the other index files fo...
阅读全文
摘要:使用Lucene过程中一直以来比较痛苦的一件事就是在它执行Optimize方法是会霸占系统大量资源(说“独占”都不为过),一个29万条数据,4G+的索引,在我的笔记本上Optimize的时间长达32分钟,这期间我几乎只能去台式机上干活。很遗憾的是起码它开放的API我还没找到控制CPU占用的方法,事实上,想象中也比较困难,因为写入磁盘IO的事情,可是计算的动作就是要消耗CPU...
阅读全文
摘要:在Apache的更新日志上看到这样一句话25 September 2009 - Lucene Java 2.9.0 availableThis release has many improvements since release 2.4.1, including: Near real-time search capabilities added to IndexWriter Oops…...
阅读全文
摘要:一直很好奇当初Apache曾经说的即将推出的UpdateDocuments()方法是个什么样的方法,Lucene索引的这种紧凑的文件结构如何能“允许”这个“Update”动作的发生呢? 千呼万唤始出来,不出所料,还是换汤不换药注释Code highlighting produced by Actipro CodeHighlighter (freewa...
阅读全文