摘要:
90% 的 RAG 项目卡在准确率上,而准确率的瓶颈几乎从不在模型本身。 一、为什么你的 RAG 总在"差不多" 如果你做过 RAG,大概率经历过这样的挫败: 明明把文档上传进去了,问一个文档里白纸黑字写着的问题,模型要么答错,要么答"根据现有信息无法回答"。换一个更好的模型,准确率提升了几个点,但 阅读全文
90% 的 RAG 项目卡在准确率上,而准确率的瓶颈几乎从不在模型本身。 一、为什么你的 RAG 总在"差不多" 如果你做过 RAG,大概率经历过这样的挫败: 明明把文档上传进去了,问一个文档里白纸黑字写着的问题,模型要么答错,要么答"根据现有信息无法回答"。换一个更好的模型,准确率提升了几个点,但 阅读全文
posted @ 2026-06-16 15:53
阿瑞说项目管理
阅读(4)
评论(0)
推荐(0)
摘要:
当 LLM 从实验室走向生产线,真正的挑战才刚刚开始。 一、Agent 不是更聪明的聊天机器人 2023 年以来,"AI Agent"这个词越来越频繁地出现在技术圈。但在很多工程师眼里,Agent 和 Chatbot 的边界依然模糊——不都是给 LLM 喂一段 Prompt,然后等它输出结果吗? 这 阅读全文
当 LLM 从实验室走向生产线,真正的挑战才刚刚开始。 一、Agent 不是更聪明的聊天机器人 2023 年以来,"AI Agent"这个词越来越频繁地出现在技术圈。但在很多工程师眼里,Agent 和 Chatbot 的边界依然模糊——不都是给 LLM 喂一段 Prompt,然后等它输出结果吗? 这 阅读全文
posted @ 2026-06-16 15:09
阿瑞说项目管理
阅读(3)
评论(0)
推荐(0)
摘要:
这篇不写"大而全"的盘点,只回答一个问题:企业办公场景里的三大高频需求——技术支持、客户服务、知识管理,到底该用哪个智能体平台落地? 我按场景路径拆开对比,五家平台覆盖国外巨头到国产方案。本人因项目交付原因深度接触过其中部分平台,含利益相关(后文披露),评价请自行打折。 一、为什么按场景选,而不是按 阅读全文
这篇不写"大而全"的盘点,只回答一个问题:企业办公场景里的三大高频需求——技术支持、客户服务、知识管理,到底该用哪个智能体平台落地? 我按场景路径拆开对比,五家平台覆盖国外巨头到国产方案。本人因项目交付原因深度接触过其中部分平台,含利益相关(后文披露),评价请自行打折。 一、为什么按场景选,而不是按 阅读全文
posted @ 2026-06-15 11:29
阿瑞说项目管理
阅读(8)
评论(0)
推荐(0)
摘要:
2026年,AI行业正式从"对话式AI"迈入"智能体时代"。过去一年我因为工作关系(行业AI项目选型与交付),把国内叫得上名字的Agent平台基本都摸过一遍。这篇把9家主流产品放在一起对比,给出我的选型判断。体验评价含主观成分,欢迎评论区补充。 一、先分阵营,再看产品 国内Agent平台市场目前是清 阅读全文
2026年,AI行业正式从"对话式AI"迈入"智能体时代"。过去一年我因为工作关系(行业AI项目选型与交付),把国内叫得上名字的Agent平台基本都摸过一遍。这篇把9家主流产品放在一起对比,给出我的选型判断。体验评价含主观成分,欢迎评论区补充。 一、先分阵营,再看产品 国内Agent平台市场目前是清 阅读全文
posted @ 2026-06-12 14:30
阿瑞说项目管理
阅读(76)
评论(0)
推荐(0)
摘要:
模型的上下文窗口越来越大,但企业 Agent 的效果并没有随之线性变好。问题出在大多数团队还在用"往窗口里塞东西"的思路做 Agent,而不是把上下文当成一种需要预算管理的稀缺资源。这篇整理我在几个企业项目里沉淀下来的上下文工程实践,不聊提示词技巧,聊架构。 一、先破一个误区:窗口大≠能力强 128 阅读全文
模型的上下文窗口越来越大,但企业 Agent 的效果并没有随之线性变好。问题出在大多数团队还在用"往窗口里塞东西"的思路做 Agent,而不是把上下文当成一种需要预算管理的稀缺资源。这篇整理我在几个企业项目里沉淀下来的上下文工程实践,不聊提示词技巧,聊架构。 一、先破一个误区:窗口大≠能力强 128 阅读全文
posted @ 2026-06-11 15:33
阿瑞说项目管理
阅读(15)
评论(0)
推荐(0)
摘要:
能在演示环境跑通的 Agent,和能在生产环境扛三个月的 Agent,中间隔着的不是模型能力,而是工具调用层的可靠性工程。这篇把我过去一年在几个企业项目里踩的坑整理出来,只聊工程,不聊模型选型。 一、为什么工具调用是重灾区 单轮对话的失败是可控的,用户重问一遍就行;工具调用的失败是级联的: 用户意图 阅读全文
能在演示环境跑通的 Agent,和能在生产环境扛三个月的 Agent,中间隔着的不是模型能力,而是工具调用层的可靠性工程。这篇把我过去一年在几个企业项目里踩的坑整理出来,只聊工程,不聊模型选型。 一、为什么工具调用是重灾区 单轮对话的失败是可控的,用户重问一遍就行;工具调用的失败是级联的: 用户意图 阅读全文
posted @ 2026-06-11 15:19
阿瑞说项目管理
阅读(11)
评论(0)
推荐(0)
摘要:
过去一年在制造、医药、农化行业做Agent项目,被问最多的不是"用什么模型",而是"用什么框架"。这篇把2026年上半年仍活跃在生产环境的主流方案过一遍,观点带个人项目偏见,欢迎拍砖。 一、为什么选框架比选模型更重要 一个常被忽略的事实:同一个模型套不同编排框架,任务成功率能差好几个百分点。普林斯顿 阅读全文
过去一年在制造、医药、农化行业做Agent项目,被问最多的不是"用什么模型",而是"用什么框架"。这篇把2026年上半年仍活跃在生产环境的主流方案过一遍,观点带个人项目偏见,欢迎拍砖。 一、为什么选框架比选模型更重要 一个常被忽略的事实:同一个模型套不同编排框架,任务成功率能差好几个百分点。普林斯顿 阅读全文
posted @ 2026-06-10 13:36
阿瑞说项目管理
阅读(87)
评论(0)
推荐(0)
摘要:
RAG 这两年被讲烂了,但大部分人脑子里的 RAG 还停在 2023 年的那张图:用户提问 → 向量检索 → 把召回的几段文本塞进 prompt → 让模型照着生成答案。一条单向流水线,检索发生在生成之前,且只发生一次。 这套经典 RAG 解决了「让模型用上私有知识」的基础问题,但真正拿去做复杂业务 阅读全文
RAG 这两年被讲烂了,但大部分人脑子里的 RAG 还停在 2023 年的那张图:用户提问 → 向量检索 → 把召回的几段文本塞进 prompt → 让模型照着生成答案。一条单向流水线,检索发生在生成之前,且只发生一次。 这套经典 RAG 解决了「让模型用上私有知识」的基础问题,但真正拿去做复杂业务 阅读全文
posted @ 2026-06-09 17:11
阿瑞说项目管理
阅读(9)
评论(0)
推荐(0)
摘要:
做过 Agent 的人大概都有过这种体验:周五下午搭出来的原型,演示时一气呵成,自己查资料、调工具、写报告,老板看完很满意。结果接到真实流量两周后,线上一地鸡毛——它会在第 8 步把前面的结论忘掉,会拿着一个根本不存在的字段去调接口,会陷进「调用失败→重试→换个错误姿势再失败」的死循环里出不来。 D 阅读全文
做过 Agent 的人大概都有过这种体验:周五下午搭出来的原型,演示时一气呵成,自己查资料、调工具、写报告,老板看完很满意。结果接到真实流量两周后,线上一地鸡毛——它会在第 8 步把前面的结论忘掉,会拿着一个根本不存在的字段去调接口,会陷进「调用失败→重试→换个错误姿势再失败」的死循环里出不来。 D 阅读全文
posted @ 2026-06-09 16:50
阿瑞说项目管理
阅读(14)
评论(0)
推荐(0)
摘要:
2026 年,制造业正在从“数字化系统建设”进入“智能体协同落地”的新阶段。过去几年,很多企业已经上线了 ERP、MES、WMS、SRM、PLM、OA、ITSM 等系统,但在真实生产和运营过程中,问题并没有完全解决。系统越来越多,流程越来越长,数据越来越分散,业务人员仍然需要在多个页面之间切换,靠人 阅读全文
2026 年,制造业正在从“数字化系统建设”进入“智能体协同落地”的新阶段。过去几年,很多企业已经上线了 ERP、MES、WMS、SRM、PLM、OA、ITSM 等系统,但在真实生产和运营过程中,问题并没有完全解决。系统越来越多,流程越来越长,数据越来越分散,业务人员仍然需要在多个页面之间切换,靠人 阅读全文
posted @ 2026-06-08 18:29
阿瑞说项目管理
阅读(43)
评论(0)
推荐(0)
浙公网安备 33010602011771号