大模型的离谱，你想象不到

写在前面

最近读莫言老师的《十三步》，坦白说，没太读明白，于是想让大模型帮我解读一下这部作品，万万没想到，大模型们的回答让我大跌眼镜。

提示：

显然，作为国外的大模型，GPT的中文语料还是不够丰富，它是真不了解莫言，更不了解其作品《十三步》，于是把“十三步”理解成了死刑执行时的十三级台阶，于是大胆胡说，离题万里。

直接拉完了。

这个模型，我问了两次，一次比一次炸裂。

可以看到，grok是了解莫言及其作品的，但学习不足，想象有余。“十三步村”、“疯子张十三”都是 grok “创造”出来的，故事情节也是完全对不上，这吹牛程度，比莫言本尊，都不遑多让。只能说，幻觉太严重了。

和上次一样，有点了解，但不多，知识不够，想象来凑。给出的故事梗概和上次截然不同，对十三步的理解也完全错误并极端炸裂，难以形容。

虽然及其炸裂，但毕竟“认”对了作品，还能指出主人公方富贵和李玉婵，怎么说也比“拉完了”强一档，给到拉。

国产大模型果然对中文内容更了解一些，但幻觉依旧很严重。红色框中的内容，都是模型自由发挥的，而绿色框中的内容，就说得比较确切了。而且，还提到了“身份”这个关键词。总之，有进步，给到NPC。

Qwen3 大最大败笔，是它把《十三步》与莫言的另一部作品《酒国》混在一起了（作家李一斗是《酒国》中的人物）。其亮点是，指出了“死后复活”、“被迫扮演他人身份”这样的关键情节。综合考评，可以给到NPC与人上人之间。

综上，给到人上人。

什么叫差距？这就叫差距！

情节掌握之准确、条理之清晰、解读之专业深刻，断档领先。

唯二的不足：一是搞错了人物关系，李玉婵是张赤球的妻子，而不是方富贵的妻子。二是对“十三步”的理解，还不够准确（到底是哪十三步，没有说出来）。

但瑕不掩瑜，顶级中的顶级，夯中的夯！

只能说，我们离遥遥领先，还有很长的路要走。

本文只是一个比较片面和极端的例子，只能反映不同大模型在某一细分领域，甚至是在当前个例上的差距，绝不能代表大模型的综合实力和整体水平。
必须承认，笔者给的Prompt还是太笼统、太简单了，如果提示词再丰富一些，或者干脆将整部作品喂给大模型，结果可能会截然不同。
笔者对大模型的原理知之甚少，对造成这种情况（不同大模型的表现差距巨大）的原因也不太清楚。一方面，如果笔者的叙述有错误疏漏指出，欢迎读者批评指正，您的批评就是在下前进的不竭动力。另一方面，如果有大神了解造成这种情况的原因，还望您不吝赐教。

posted @ 2025-12-02 08:33 同勉共进阅读(1344) 评论(3) 收藏举报

刷新页面返回顶部