马尔可夫假设的 “缺陷”

这段页讲马尔可夫假设的 “缺陷”，大白话拆成 3 个槽点 + 1 个安慰：

槽点 1：“前面很远的词可能影响当前词”（long distance dependency）

人话：有时候，当前词的意思，得看前面老远的词才能确定。
例子：“我读过关于马尔可夫的生平的书”“我看过… 电影”“我听过… 故事” 。这里 “读、看、听”，得和最后面的 “书、电影、故事” 配对才合理，但马尔可夫假设只看 “前面有限几个词”，可能抓不到这种长距离的依赖关系。

槽点 2：“后面的词可能影响当前词”

人话：当前词的意思，还可能被后面的词决定，但马尔可夫假设只看 “前面的词”，不管后面。
比如：“因为下雨，所以___” 。填 “带伞” 还是 “取消”，得看后面的词，但马尔可夫假设算 “带伞” 的概率时，只看前面 “下雨、所以”，可能判断不准。

槽点 3：“影响当前词的因素可能不在文中”

人话：有些词的意思，得结合 “上下文之外的知识” （比如常识、背景），但马尔可夫假设只统计 “文中的词”，没常识。
比如：“马化腾是___的 CEO” 。填 “腾讯” 得靠常识，但模型光看文中的词，可能不知道。

最后安慰：“虽然有缺陷，但还能用”

人话：马尔可夫假设是 “简化版规则”，虽然漏了很多情况，但 “简单又能凑合解决问题” ，所以实际中还是能做出有用的模型（比如早期的语音识别、输入法）。

总结：马尔可夫假设像 “近视眼 + 没常识” 的裁判，只能看到眼前几个词，看不到远处、后面的词，也不懂课外知识～但因为它 “好养活（计算简单）”，所以虽然有缺陷，还是能凑合干活！

posted @ 2025-06-22 09:42 m516606428 阅读(13) 评论(0) 收藏举报

刷新页面返回顶部