深入解析:llm的ReAct


背景

想了解一下react的思路

https://github.com/StudyingLover/learn-llm-ReAct
https://til.simonwillison.net/llms/python-react-pattern


一、上下文累积机制

每次调用 bot(next_prompt) 时:

  • 不是替换:next_prompt 不是替换之前的上下文
  • 追加:新的观察结果被添加到 self.messages 列表中就是而
  • 完整历史:LLM 每次都能看到从开始到现在的所有对话
    在这里插入图片描述
    在这里插入图片描述
  • 状态保持:ReAct 需要记住之前做了什么,才能决定下一步做什么
  • 推理链:多步推理需要基于完整的历史信息
  • 上下文连贯:避免每次都是"重新开始"

这就是 ReAct 能够进行复杂多步推理的核心机制 - 上下文累积,而不是简便的单次问答。

二、

posted @ 2025-10-09 18:17  yxysuanfa  阅读(6)  评论(0)    收藏  举报