2010年9月29日
摘要: (注:如有转载请标明作者:finallyliuyu, 和出处:博客园)《文本分类 step by step(一)》  在《文本分类step by step(一)》中,我们从处理语料库开始讲起,一直讲到利用分类器进行分类。文章末尾还随机抽取了一篇文章,给出了这篇文章的标题、正文、实际类别,分类器所分类别等信息。在此篇博客中我们将介绍分类器的评估,以及代码的一些介绍,最后给出程序和实验语料库的下载地址... 阅读全文
posted @ 2010-09-29 19:30 finallyly 阅读(4710) 评论(5) 推荐(3) 编辑
摘要: 运行情况截图:结果的部分截图:(数据结构含义:比如“和睦”这个词”第一行term,第二行term出现在多少篇文章中,第三行:在id为多少的文章中出现过几次) · 特征词选择 代码中实现了两种特征词选择算法(DF法和chi-square法)。这里仅给出对chi-square特征词选择算法的调用。使用chi-square特征词选择法,首先需要构造出con... 阅读全文
posted @ 2010-09-29 14:55 finallyly 阅读(8381) 评论(22) 推荐(1) 编辑