摘要:
先规范一下发间:bow的韵音同low而不是cow。bow包含三个项目:rainbow用于文本分类;arrow用于文本检索;crossbow用于文本聚类。这三个程序是独立的。Rainbow使用rainbow前首先要建立原始文档的一个model----包含了原始文档的一些统计信息,使用rainbow命令时通过-d选项来指定model的路径。rainbow -d ~/model --index ~/20_newsgroups/*以上命令是为 20_newsgroups所有分类创建model,生成~/model文件。--index目录可以分别写:rainbow -d ~/model --index ~ 阅读全文