摘要:        
转自:http://hi.baidu.com/zzpppork/blog/item/c1c79cfadbfe0a6e034f5683.html在向量空间模型中,文本泛指各种机器可读的记录。用D(Document)表 示,特征项(Term,用t表示)是指出现在文档D中且能够代表该文档内容的基本语言单位,主要是由词或者短语构成,文本可以用特征项集表示为 D(T1,T2,…,Tn),其中Tk是特征项,1<=k<=N。例如一篇文档中有a、b、c、d四个特征项,那么这篇文档就可以表示为 D(a,b,c,d)。对含有n个特征项的文本而言,通常会给每个特征项赋予一定的权重表示其重要程度。即 D=    阅读全文
        
            posted @ 2012-05-01 16:43
iLocationStudio
阅读(305)
评论(0)
推荐(0)
        
        
                    
                
浙公网安备 33010602011771号