会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
代码那些事
工作点点滴滴
博客园
首页
新随笔
联系
订阅
管理
2013年8月15日
《lucene原理与代码分析》笔记
摘要: 1.全文索引相对于顺序扫描的优势:一次索引,多次使用2.创建索引的步骤:(1)要索引的原文档 (2)将原文档传给分词组件(Tokenizer)分词组件会做如下事情:(此过程称为Tokenize)a.将文档分成一个一个的单词b.去除标点符号c.去除停词(Stop Word) **停词就是语句中无意义的
阅读全文
posted @ 2013-08-15 10:12 CalronLoveRonnie
阅读(2306)
评论(0)
推荐(0)
公告