该文被密码保护。 阅读全文
posted @ 2017-03-21 15:10
blcblc
阅读(1)
评论(0)
推荐(0)
摘要:
在做文本挖掘,特别是有监督的学习时,常常需要从文本中提取特征,提取出对学习有价值的分类,而不是把所有的词都用上,因此一些词对分类的作用不大,比如“的、是、在、了”等停用词。这里介绍两种常用的特征选择方法: 互信息 一个常用的方法是计算文档中的词项t与文档类别c的互信息MI,MI度量的是词的存在与否给 阅读全文
posted @ 2017-03-21 13:59
blcblc
阅读(678)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2017-03-21 11:16
blcblc
阅读(2)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2017-03-21 00:07
blcblc
阅读(1)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2017-03-21 00:04
blcblc
阅读(4)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2017-03-21 00:00
blcblc
阅读(1)
评论(0)
推荐(0)

浙公网安备 33010602011771号