12 2025 档案
摘要:一、介绍 CoT(Chain of Thought)思维链是一种能够激发大模型潜力,提升模型解决复杂推理问题(如数学逻辑问题、常识问题和符号逻辑问题)正确率的经典提示方法。其原理是通过在提示词中提供带有分步推理过程的few-shot examples(少量示例),或者添加明确的“请一步一步思考”指令
阅读全文
摘要:最近在开发和调试模型应用时,常常感到困惑,当我的智能体表现跟预期不一样,我该改哪里? 可能是模型犯傻,可能是提示词写得不够好,可能是我的智能体架构没办法完成这么复杂的问题,那么,该从哪里入手呢? 决策指南:系统化的调试排查清单 面对问题,不要盲目尝试,应该遵循一个系统化的排查路径,从最简单、成本最低
阅读全文
摘要:在langchain Tools工具的基础使用中,工具方法的参数是由大模型生成schema来调用的。除了schema定义的参数外,tools还有一类特定的内置参数:runtime。 runtime是一个内部定义好的ToolRuntime类型结构,里面有state、context、store、stre
阅读全文
摘要:一. 原理 在我的上一篇笔记中,记录了如何使用原生的大模型进行工具调用:https://www.cnblogs.com/nanimono/p/19295032。让大模型进行工具调用本质上并不是让模型自动调用工具并返回结果,而是: 1. 在输入给模型的数据中定义对工具(函数)名字、功能、参数名及介绍的
阅读全文
摘要:DeepSeek今天发布了V3.2,深度思考模式首次支持工具调用,并且将最大输出token长度扩充至32k-64k。同时,发布了一个测试版的v3.2-speciale,该模型可以看做一个超级加强版长思考DeepSeek,具有出色的数学推理能力和高复杂任务解决能力。但既不支持工具调用,也没有针对日常应
阅读全文
摘要:一. 需求 最近想实现一个简单的功能:用户输入一个餐厅名关键词,agent调用高德地图api,拿到餐厅的一些关键信息,如准确店名、地址(文字地址+经纬度)、评分、人均、营业时间等,接下来agent将接口返回的数据整理,形成更精简的结构化json,存入数据库。只获取餐厅信息并存库是没太多业务价值的,第
阅读全文
浙公网安备 33010602011771号