03 2015 档案
摘要:在文本分类中,用于特征选择的统计量主要有这些:特征频度(term frequency,tf)原理是:低频的往往对分类影响不大,从而可以被排除掉。同时,不是所以高频都是影响大的,比如在文本中分布均匀的高频的贡献是不大的。应用: 主要用在文本标引时直接删除某些低频特征 2. 文本频度(documen...
阅读全文
摘要:一、发展 起源:统计语言模型起源于 Ponte 和 Croft 在 1998年的 SIGIR上发表的论文 应用:语言模型的应用很多: corsslingual retrieval distributed IR expert finding passage retrieval web search g
阅读全文
摘要:一直想坚持用博客,曾经也试图开始,申请了几个,试用了几个。今天突发奇想再次启用,但发现竟然不记得我注册是哪一个了??突然浮现博客园,一百度果然有这个博客,一登录竟然没有注册过!! SO,果断选择这个了,纪念一下哈哈
阅读全文


浙公网安备 33010602011771号