摘要:
在文本分类中,用于特征选择的统计量主要有这些:特征频度(term frequency,tf)原理是:低频的往往对分类影响不大,从而可以被排除掉。同时,不是所以高频都是影响大的,比如在文本中分布均匀的高频的贡献是不大的。应用: 主要用在文本标引时直接删除某些低频特征 2. 文本频度(documen... 阅读全文
posted @ 2015-03-20 11:50
betterSN
阅读(1745)
评论(0)
推荐(0)
摘要:
一、发展 起源:统计语言模型起源于 Ponte 和 Croft 在 1998年的 SIGIR上发表的论文 应用:语言模型的应用很多: corsslingual retrieval distributed IR expert finding passage retrieval web search g 阅读全文
posted @ 2015-03-20 11:30
betterSN
阅读(371)
评论(0)
推荐(0)


浙公网安备 33010602011771号