基于大语言模型的智能体(LLM Based Agent)

就是说要聊聊靠大语言模型来打造 “智能小助手”(Agent)的事儿 ,这些小助手能像有逻辑、有状态的 “小脑瓜” 一样工作。

“从无状态,到特定状态的定义和识别”

以前大模型输出可能比较 “没条理、没记忆延续性”(无状态),现在要想办法让基于大模型的智能体,能明确 “不同阶段该啥样(定义特定状态)”,还能 “认出自己当下处于啥阶段(识别状态)” ,就像从一个 “懵懂乱跑” 的状态,变得会规划步骤、知道自己每一步该干啥。

“什么是无状态?什么是有状态?什么是连续?什么是离散?”

  • 无状态:就像你和人聊天,对方说完就忘,每次对话都是新的、不记之前内容,大模型要是这样,就是无状态,没法把之前交流的事儿串起来用。
  • 有状态:相反,像你和朋友唠嗑,能顺着之前的话题接着聊,智能体要是能记住之前的操作、对话内容,根据这些来接着干活、交流,就是有状态,能 “连贯思考做事”。
  • 连续:可以理解成事物是 “连绵不断” 的变化,比如音乐里的声音,是平滑、持续变化的声波,没有明显的分割;或者你跑步的速度,也是一点点连续改变的。
  • 离散:把连续的东西 “砍成一段一段、一个一个单独的” 。比如音乐里的音符,把连续的声波,拆成 do、re、mi 这些单独的音符;还有我们数人数,1 个、2 个,也是离散的,是一个个独立的个体。

“人类智能,将连续性进行离散化,从而完成了工业化。比如音乐。”

人类厉害的地方在于,把那些连续变化、不好把控的东西,拆成一个个离散的、好处理的 “小单元”,这样就能大规模生产、标准化搞事情(工业化)。就说音乐,本来声音是连续的声波,不好直接用来大规模创作、演奏、传播,人类把它拆成音符(离散化),这样就有了乐谱,大家按乐谱就能演奏,还能批量教、批量学,搞出音乐工业,像唱片制作、歌曲创作流水线这些。

“Agent,将无状态输出的大模型,变成了有状态输出的逻辑大脑,目标也是工业化。”

智能体(Agent)要干的事儿,就是把原本 “输出没条理、不记事儿(无状态)” 的大模型,改造成 “有记忆、有逻辑,知道自己处于啥阶段、该咋推进任务(有状态输出)” 的 “聪明小脑瓜” 。最终目标也是像人类把音乐搞成工业化那样,让智能体的工作能标准化、规模化,比如能批量处理任务、稳定高效地帮人干活,形成一套 “智能体工业体系” 。

“用好 Agent 的关键,思考哪些东西值得被离散化、状态化。不断测试大模型的能力,并研究如何提高状态判断的准确度。”

想把智能体用得好,得琢磨清楚:在具体任务里,哪些连续的、不好处理的东西,得拆成离散的小单元(离散化);哪些过程、信息得让智能体记住状态(状态化)。同时,得不断试试大模型本身能力咋样,看看它在处理任务时,能不能准确判断自己处于啥状态、下一步咋做,研究咋让它判断得更准,这样智能体才能更好干活 。

简单说,就是想办法让大模型变身成 “有逻辑、有记忆、能按步骤办事” 的智能小助手,还得像人类搞工业化那样,把事儿拆细、搞标准,让这些小助手能稳定、批量地帮人解决问题,过程中得不断调试、优化,让它们更聪明好用 。
posted @ 2025-06-16 20:32  m516606428  阅读(47)  评论(0)    收藏  举报