摘要:
特征选择之Chi卡方检验 卡方值越大,说明对原假设的偏离越大,选择的过程也变成了为每个词计算它与类别Ci的卡方值,从大到小排个序(此时开方值越大越相关),取前k个就可以。 针对英文纯文本的实验结果表明:作为特征选择方法时,开方检验和信息增益的效果最佳(相同的分类算法,使用不同的特征选择算法来得到比较 阅读全文
posted @ 2018-09-04 16:40
TMatrix52
阅读(1066)
评论(0)
推荐(0)
浙公网安备 33010602011771号