作者:finallyliuyu  注:数据使用请注明来源

 

试验数据下载

资源中包括 数据集规模为200,1000,2000,3000,情况下,特征维数分别为10,20,30-150的情况下5这交叉验证的全部正确率。其中文件命名为TextCategorization_0_100_10表示这是在文档集规模为200(一个类别中有100篇文章)下进行的第一折试验,当前特征维数为10。每个这样的文件夹下面包含文件train.libsvm(训练数据集),test.libsvm(测试数据集)以及最后试验得出的准确率accuracy.txt.(我在试验中libsvm采用的是线性核)

特征词选择算法对文本分类准确率的影响(一):讨论特征选择算法是否有效

特征词选择算法对文本分类准确率的影响(二):介绍本次实验的一些前提和基础以及中间数据格式等

特征词选择算法对文本分类准确率的影响(三):讨论特征词数量,VSM模型维数对分类准确率的影响,纠正特征词数目越多,VSM模型维数越高,分类越准确的观点

特征词选择算法对文本分类准确率的影响(四):在经典概率模型(课本论文中都是此模型)下的分类准确率

特征词选择算法对文本分类准确率的影响(五):在如我一样的layman设计的概率模型下分类准确率的情况

posted on 2010-08-17 22:23  finallyly  阅读(2967)  评论(6编辑  收藏  举报