摘要:
根据2元统计语言模型,最优可能的一种划分s1,s2,..sn 满足下面的值最大:P(s) = max(p(s1) * p(s2|s1)* ... * p(sn|sn-1);一般两边取对数 lnp(s) = max(ln(p(s1)) + ln(p(s2|s1)) + ... + ln(p(sn|sn-1)))那么一条路径的长度为:wi = ln(p(si|si-1))但是,在中科院分词系统的源代码... 阅读全文
posted @ 2009-08-04 16:59
暮夏
阅读(751)
评论(0)
推荐(0)
浙公网安备 33010602011771号