2011年2月10日

SQLite全文检索(2)

摘要: 距上一篇有好久了,因为乏人问津所以一直也没写这第二篇。年前看到有人给我发消息问 SQLite 全文检索的事,我想哪怕只有一个人看吧,我也整理整理。这一篇就写写如何扩展 SQLite 使它支持东亚文字的切词。熟悉 Lucene 的童鞋大概知道,切词是在索引时进行的。对 SQLite 来说,也就是 INSERT UPDATE 时发生切词。SQLite 的做法是,在定义 FTS 虚表时指定切词器:还记得“porter”吗?当然这里不是哈利波特,其实是指Martin Porter设计的切词算法。或许你在 Lucene 里见过,这个切词器主要用于英语词的整形(如复 阅读全文

posted @ 2011-02-10 07:33 破宝 阅读(4462) 评论(12) 推荐(6) 编辑

导航