摘要:
http://yshjava.iteye.com/blog/1560661 为何要计算文档相似性 在今年年初的时候,我开始尝试做文本的自动聚类,当时是从网上,找到的一个K-Means算法,稍作了修改。从测试结果来看,分类效果 不太好,究其原因,我认为有两个,一个是词库的问题,停用词词库太小,没有噪音 阅读全文
posted @ 2016-01-27 14:49
xxxxxxxx1x2xxxxxxx
阅读(465)
评论(0)
推荐(0)
浙公网安备 33010602011771号