摘要:
Lucene对文本解析是作为全文索引及全文检索的预处理形式出现的,因此在一般的Lucene文档中,这一部分都不是重点,往往一带而过,但是对于要建立基于文本的内容推荐引擎来说,却是相当关键的一步,因此有必要认真研究一下Lucene对文解析的过程。Lucene对文本的解析对用户的接口是Analyzer的某个子类,Lucene内置了几个子类,但是对于英文来说StandardAnalyzer是最常用的一个子类,可以处理一般英文的文解析功能。但是对于汉字而言,Lucene提供了两个扩展包,一个是CJKAnalyzer和SmartChineseAnalyzer,其中SmartAnalyzer对处理中文分词 阅读全文
随笔档案-2011年8月16日
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用9
2011-08-16 08:37 by java ee spring, 190 阅读, 收藏,
摘要:
辞职创业吴言在经过了几天的反复思考,终于下定决心辞职创业了。做出这个决定真的需要很大的勇气,因为自己的年纪做为程序员来说,已经属于很高龄了,如果创业失败几乎没有退路,再找工作将很难,合适的工作几乎是不可能的。但是如果一辈子就这么重复着当下的生活,他又不甘心,非常的不甘心,放弃一切也要尝试一把的诱惑使他难以抗拒。整整一个上午,吴言都在早已写好的辞职邮件界面上,他需要鼓足勇气才能按下发送按钮,但是每一次他都在最后一刻放弃了,终于在近乎于误操作的情形下,他按下了发送按钮。终于,吴言如释重负,完成了一件大事。但是心里也有了一丝的不安,创业失败和失业这些词时常在脑海里闪现,每到想起这些,吴言都会觉得脊背 阅读全文
浙公网安备 33010602011771号