马尔可夫假设的 “缺陷”

这段页讲马尔可夫假设的 “缺陷”,大白话拆成 3 个槽点 + 1 个安慰:

槽点 1:“前面很远的词可能影响当前词”(long distance dependency)

  • 人话:有时候,当前词的意思,得看前面老远的词才能确定 。
  • 例子:“我读过关于马尔可夫的生平的书”“我看过… 电影”“我听过… 故事” 。这里 “读、看、听”,得和最后面的 “书、电影、故事” 配对才合理,但马尔可夫假设只看 “前面有限几个词”,可能抓不到这种长距离的依赖关系。

槽点 2:“后面的词可能影响当前词”

  • 人话:当前词的意思,还可能被后面的词决定 ,但马尔可夫假设只看 “前面的词”,不管后面。
  • 比如:“因为下雨,所以___” 。填 “带伞” 还是 “取消”,得看后面的词,但马尔可夫假设算 “带伞” 的概率时,只看前面 “下雨、所以”,可能判断不准。

槽点 3:“影响当前词的因素可能不在文中”

  • 人话:有些词的意思,得结合 “上下文之外的知识” (比如常识、背景),但马尔可夫假设只统计 “文中的词”,没常识。
  • 比如:“马化腾是___的 CEO” 。填 “腾讯” 得靠常识,但模型光看文中的词,可能不知道。

最后安慰:“虽然有缺陷,但还能用”

  • 人话:马尔可夫假设是 “简化版规则”,虽然漏了很多情况,但 “简单又能凑合解决问题” ,所以实际中还是能做出有用的模型(比如早期的语音识别、输入法 )。

总结:马尔可夫假设像 “近视眼 + 没常识” 的裁判,只能看到眼前几个词,看不到远处、后面的词,也不懂课外知识~ 但因为它 “好养活(计算简单)”,所以虽然有缺陷,还是能凑合干活!
posted @ 2025-06-22 09:42  m516606428  阅读(13)  评论(0)    收藏  举报