TOP

大模型的离谱,你想象不到

写在前面

最近读莫言老师的《十三步》,坦白说,没太读明白,于是想让大模型帮我解读一下这部作品,万万没想到,大模型们的回答让我大跌眼镜。

提示:

  1. 建议没有读过《十三步》的读者先去了解一下作品的梗概,然后您就能理解大模型是多么得离谱了。
  2. 对所有大模型,Prompt均为“请解读一下中国作家莫言的作品《十三步》。”。
  3. 截图并不是大模型给出的完整答案,只截取部分内容,就足以体现回答的离谱程度。
  4. 部分截图中码掉了部分文字,原因是怕不过审,当然,这不是大模型的原因,而是作品本身尺度太大的缘故。 

由拉到夯,一起开开眼吧

1. GPT 5.1

image

显然,作为国外的大模型,GPT的中文语料还是不够丰富,它是真不了解莫言,更不了解其作品《十三步》,于是把“十三步”理解成了死刑执行时的十三级台阶,于是大胆胡说,离题万里。

直接拉完了。

2. grok-4.1-thinking

这个模型,我问了两次,一次比一次炸裂。

第一次回答

image

可以看到,grok是了解莫言及其作品的,但学习不足,想象有余。“十三步村”、“疯子张十三”都是 grok “创造”出来的,故事情节也是完全对不上,这吹牛程度,比莫言本尊,都不遑多让。只能说,幻觉太严重了。

第二次回答

image

 和上次一样,有点了解,但不多,知识不够,想象来凑。给出的故事梗概和上次截然不同,对十三步的理解也完全错误并极端炸裂,难以形容。

虽然及其炸裂,但毕竟“认”对了作品,还能指出主人公方富贵和李玉婵,怎么说也比“拉完了”强一档,给到拉。

3. kimi-k2-thinking-turbo

image

 

国产大模型果然对中文内容更了解一些,但幻觉依旧很严重。红色框中的内容,都是模型自由发挥的,而绿色框中的内容,就说得比较确切了。而且,还提到了“身份”这个关键词。总之,有进步,给到NPC。

 4. Qwen3-Max

image

 Qwen3 大最大败笔,是它把《十三步》与莫言的另一部作品《酒国》混在一起了(作家李一斗是《酒国》中的人物)。其亮点是,指出了“死后复活”、“被迫扮演他人身份”这样的关键情节。综合考评,可以给到NPC与人上人之间。

5. deepseek

image

 

  • 准确地给出了“死而复生”、“换脸”、“笼中叙事者”等大量关键情节。
  • 解读也比较深刻和准确,如市场化浪潮(主人公张赤球去做生意、学校开办兔肉加工厂等都是体现)。
  • 虽然故事梗概依然不够详细和准确,但至少没有明显的错误和过度发挥。

综上,给到人上人。

6. gemini-3-pro

image

image

image

 

image

什么叫差距?这就叫差距!

情节掌握之准确、条理之清晰、解读之专业深刻,断档领先。

唯二的不足:一是搞错了人物关系,李玉婵是张赤球的妻子,而不是方富贵的妻子。二是对“十三步”的理解,还不够准确(到底是哪十三步,没有说出来)。

但瑕不掩瑜,顶级中的顶级,夯中的夯!

只能说,我们离遥遥领先,还有很长的路要走。

写在后面

  • 本文只是一个比较片面和极端的例子,只能反映不同大模型在某一细分领域,甚至是在当前个例上的差距,绝不能代表大模型的综合实力和整体水平。
  • 必须承认,笔者给的Prompt还是太笼统、太简单了,如果提示词再丰富一些,或者干脆将整部作品喂给大模型,结果可能会截然不同。
  • 笔者对大模型的原理知之甚少,对造成这种情况(不同大模型的表现差距巨大)的原因也不太清楚。一方面,如果笔者的叙述有错误疏漏指出,欢迎读者批评指正,您的批评就是在下前进的不竭动力。另一方面,如果有大神了解造成这种情况的原因,还望您不吝赐教。
posted @ 2025-12-02 08:33  同勉共进  阅读(216)  评论(2)    收藏  举报