摘要: 先规范一下发间:bow的韵音同low而不是cow。bow包含三个项目:rainbow用于文本分类;arrow用于文本检索;crossbow用于文本聚类。这三个程序是独立的。Rainbow使用rainbow前首先要建立原始文档的一个model----包含了原始文档的一些统计信息,使用rainbow命令时通过-d选项来指定model的路径。rainbow -d ~/model --index ~/20_newsgroups/*以上命令是为 20_newsgroups所有分类创建model,生成~/model文件。--index目录可以分别写:rainbow -d ~/model --index ~ 阅读全文
posted @ 2011-09-27 21:44 张朝阳 阅读(956) 评论(0) 推荐(0) 编辑