随笔分类 -  carrot2学习

摘要:RawCluster:聚类中的类别单位RawCluster.getDocuments():获得该类的文档列表RawDocument:每个类的文档单位STC:后缀树表示法2008-11-13Carrot2的组建(components)的介绍:1. 输入(input):产生聚类文本的组建。Carrot2针对目前的几个主要搜索引擎(Yahoo:carrot2-input-yahooapi.jar, Google, MSN Search)和开源搜索引擎(lucene:carrot2-input-lucene.jar)以及XMLs接口 (such as RSS or OpenSearch:carrot2 阅读全文
posted @ 2014-03-13 10:01 风未馨 阅读(578) 评论(0) 推荐(0)