GPT4的局限性

GPT-4 所采用的「预测下一个词」模式，存在着明显的局限性：模型缺乏规划、工作记忆、回溯能力和推理能力。

由于模型依赖于生成下一个词的局部贪婪过程，而没有对任务或输出的全局产生深入的理解。因此，GPT-4 擅长生成流畅且连贯的文本，但不擅长解决无法以顺序方式处理的复杂或创造性问题。

比如，用范围在 0 到 9 之间的四个随机数进行乘法和加法运算。在这个连小学生都能解决的问题上，GPT-4 的准确率仅为 58%。

当数字在 10 到 19 之间，以及在 20 到 39 之间时，准确率分别降至 16% 和 12%。当数字在 99 到 199 的区间时，准确率直接降至 0。

然而，如果让 GPT-4「花时间」回答问题，准确率很容易提高。比如要求模型使用以下提示写出中间步骤：

116 * 114 + 178 * 157 = ?

让我们一步一步思考，写下所有中间步骤，然后再产生最终解。

此时，当数字在 1-40 的区间时，准确率高达 100%，在 1-200 的区间时也达到了 90%。