摘要: 延伸阅读: 1.N-1阶马尔可夫假设: 2.零概率和平滑方法: 假定在语料库中出现r次的词有Nr个,未出现的词数为N0,语料库的大小为N。那么显然: 出现r次的词在整个语料库中的相对频度则是r/N,如果不做任何优化处理,就是这个相对频度作为这些词的概率估计。 现在假定当r比较小时,它的统计可能不可靠 阅读全文
posted @ 2018-03-15 13:49 随风行云 阅读(966) 评论(0) 推荐(0)