这段页讲马尔可夫假设的 “缺陷”,大白话拆成 3 个槽点 + 1 个安慰:
- 人话:有时候,当前词的意思,得看前面老远的词才能确定 。
- 例子:“我读过关于马尔可夫的生平的书”“我看过… 电影”“我听过… 故事” 。这里 “读、看、听”,得和最后面的 “书、电影、故事” 配对才合理,但马尔可夫假设只看 “前面有限几个词”,可能抓不到这种长距离的依赖关系。
- 人话:当前词的意思,还可能被后面的词决定 ,但马尔可夫假设只看 “前面的词”,不管后面。
- 比如:“因为下雨,所以___” 。填 “带伞” 还是 “取消”,得看后面的词,但马尔可夫假设算 “带伞” 的概率时,只看前面 “下雨、所以”,可能判断不准。
- 人话:有些词的意思,得结合 “上下文之外的知识” (比如常识、背景),但马尔可夫假设只统计 “文中的词”,没常识。
- 比如:“马化腾是___的 CEO” 。填 “腾讯” 得靠常识,但模型光看文中的词,可能不知道。
- 人话:马尔可夫假设是 “简化版规则”,虽然漏了很多情况,但 “简单又能凑合解决问题” ,所以实际中还是能做出有用的模型(比如早期的语音识别、输入法 )。
总结:马尔可夫假设像 “近视眼 + 没常识” 的裁判,只能看到眼前几个词,看不到远处、后面的词,也不懂课外知识~ 但因为它 “好养活(计算简单)”,所以虽然有缺陷,还是能凑合干活!