摘要:        
根据2元统计语言模型,最优可能的一种划分s1,s2,..sn 满足下面的值最大:P(s) = max(p(s1) * p(s2|s1)* ... * p(sn|sn-1);一般两边取对数 lnp(s) = max(ln(p(s1)) + ln(p(s2|s1)) + ... + ln(p(sn|sn-1)))那么一条路径的长度为:wi = ln(p(si|si-1))但是,在中科院分词系统的源代码...    阅读全文
        
            posted @ 2009-08-04 16:59
暮夏
阅读(746)
评论(0)
推荐(0)
        
        
                    
                
浙公网安备 33010602011771号