摘要:
转载:http://www.kankanews.com/ICkengine/archives/4944.shtml这里面要注意一下,IK本身有一个文件叫IKAnalyzer.cfg.xml这个文件可以自己配置词典,词典有两种分别是ext_dict及ext_stopwords,其中ext_dict主要定义了一些关键字,这些关键字不会被分词分开,ext_stopwords主要配置停止词,什么是停止词呢?比如“的”,“得”,“我”这些没有具体意义但是又出现特别多的词就不应该作为关键字词出现,所以在分词的时候要把这些词过滤掉首先Dictionary类会加载所有词典,成map结果,以isEnd()标志结 阅读全文
posted @ 2013-12-13 14:49
曹守鑫
阅读(2926)
评论(0)
推荐(1)

浙公网安备 33010602011771号