GPT-4 所采用的「预测下一个词」模式,存在着明显的局限性:模型缺乏规划、工作记忆、回溯能力和推理能力。

由于模型依赖于生成下一个词的局部贪婪过程,而没有对任务或输出的全局产生深入的理解。因此,GPT-4 擅长生成流畅且连贯的文本,但不擅长解决无法以顺序方式处理的复杂或创造性问题。

比如,用范围在 0 到 9 之间的四个随机数进行乘法和加法运算。在这个连小学生都能解决的问题上,GPT-4 的准确率仅为 58%。

当数字在 10 到 19 之间,以及在 20 到 39 之间时,准确率分别降至 16% 和 12%。当数字在 99 到 199 的区间时,准确率直接降至 0。

然而,如果让 GPT-4「花时间」回答问题,准确率很容易提高。比如要求模型使用以下提示写出中间步骤:

 

116 * 114 + 178 * 157 = ?

让我们一步一步思考,写下所有中间步骤,然后再产生最终解。

 

此时,当数字在 1-40 的区间时,准确率高达 100%,在 1-200 的区间时也达到了 90%。

 

posted on 2023-05-16 21:13  风生水起  阅读(115)  评论(0编辑  收藏  举报