08-17 19:26

 

特征词选择算法对文本分类准确率的影响(二)

特征词选择算法对文本分类准确率的影响(一)

本节的题目是:是不是特征词的数目越高?VSM模型的特征维数越高,分类的准确率越高呢?

很多人会想当然地认为应该是VSM模型的维数越高,也即所选的特征词数目越多,分类准确率越高。但答案是否定的。我们看下面的这张图就知道了。





从上面的图片我们可以看到当文档集规模》2000时(red line,green line cyan line),(我实验的文档规模分别为200,1000,2000,3000),准确率随着特征维数的增加呈现平稳递减的趋势

posted on 2010-08-30 19:50  finallyly  阅读(2342)  评论(0编辑  收藏  举报