文本分类博文收集

 

kNN 文本分类

K-means 文本聚类

 

1.预处理
标签处理
分词标注 ictclas-linux32-jni
去停用词

 

2.倒排索引,词频统计

 

 

 

4.分类器

svm    
knn     

 

5.性能评价
正确率
召回率
F1测度

 

 

 

 

 

 

 

 

posted @ 2014-01-15 10:24  夏树  阅读(249)  评论(0编辑  收藏  举报