随笔分类 - Agent
【原创】智能体记忆系统设计 ——基于意图驱动与模块化治理的融合架构
摘要:智能体记忆系统设计 ——基于意图驱动与模块化治理的融合架构
阅读全文
经验沉淀
摘要:工作内容是「给AI出题」——但不是为了让它答对,而是为了让它答错,然后再手把手教会它,如何像年薪百万的「高级牛马」们一样做咨询。 https://mp.weixin.qq.com/s/faHHXuQiC7ro76UqMgPElQ
阅读全文
用户意图理解
摘要:简单的数据泛化,加上“规则+向量+大模型”三层决策架构,仍不是最优方案。 假定向量匹配小于阈值,用大模型直接解析,在分类很多的情况效率会非常低。如果底层数据结构是知识图谱的话,可以提取用户问题中的实体,采用实体映射,可以是一个性价比更好的方案。 问题规范化处理-->问题语义分析-->图谱推理查询--
阅读全文
图谱与大模型应用随感
摘要:传统图谱三元组的最大问题是建设时没有目标,导致生成大量实体,一方面准确率不好保证,另一方面生成效率低,可用性差。例如“A 是 程序员”,“A 是 滴滴司机”,都是正确的但发生在不同时间;我关注的核心不是冲突,而是我为什么需要拆解这个三元组。如果我做的是排障,就像专家一样,只需要抽取和排障流程相关的内
阅读全文
本体论的关键
摘要:“那么,为什么 Palantir 能如此卓越,与其它技术公司拉开如此大的差距?我认为一个根本性的战略区分,在于它对两个概念的界定:‘能力(Capability)’与 ‘专业技能(Competency)’。” “Capability 是向外能够展示的能力,关注的是最终想要实现的目的,是关心‘做什么’和
阅读全文
智能体记忆
摘要:要解决的问题: 哪些内容需要保存成长期记忆?什么时候保存?由谁来判断?未来如何召回?召回粒度是多少?如何修剪、更新、合并? https://mp.weixin.qq.com/s/sdi3rgDRiRWhsmbDWc-w-g
阅读全文
Palantir Ontology 技术深度解析:化繁为简,连接数据与决策的数字孪生
摘要:Palantir Technologies,这家以《指环王》中“真知晶球”命名的大数据分析公司,其核心技术之一 Ontology(本体) 正是其平台(如 Foundry 和 Gotham)实现强大数据整合与决策能力的关键。Ontology 不仅仅是一个数据库或数据模型,它更是一个动态的、可操作的“数
阅读全文
AI智能体元年:六大实战启示(麦肯锡)
摘要:成功部署AI智能体绝非易事。在AI智能体兴起一年后的今天,一个共识日益清晰:要想做好这件事,需要下真功夫、硬功夫。过去几个月,我们已探讨过生成式AI在价值创造和规模化方面的潜力。本文希望帮助致力于AI智能体部署的企业少走弯路、实现价值创造。 智能体驱动的企业转型,有望带来前所未有的生产力跃升。部分企
阅读全文
从Palantir本体论,看驱动智能(Data for AI)的下一代数据架构
摘要:Palantir通过将原始数据进行语义转化,为大模型的智能分析和决策打下了基础。语义转化分为4个层次: 数据语义:进行数据治理,将数据结构化、标准化 业务语义:定义实体之间的业务关系(Link) 逻辑语义:将业务规则、计算逻辑(Logic)附加到实体和关系上 决策语义:沉淀和积累决策模型与经验,支持
阅读全文
Palantir实体工程实践
摘要:Naive RAG,是试图让AI在没有地图的情况下,靠嗅觉找到宝藏。 Complex Agent,是试图训练一个没有地图的AI,学会使用各种交通工具。 而真正的出路,是Ontology RAG。它的核心,不是让AI更“能干”,而是让AI先“看懂世界”。 Ontology具体做了什么事情? 我们结合航
阅读全文
Github上文本切分相关的优秀项目
摘要:Github上有几个不错的文本切分相关的优秀项目,涵盖了不同技术方向和应用场景: AntSK-FileChunk 特点:基于语义理解的智能文本切片工具,支持PDF、Word、纯文本等多种格式,通过语义分析和向量计算确保切片的语义完整性和连贯性。 GitHub地址:https://github.com
阅读全文
Palantir本体论以及对智能体建设的价值与意义
摘要:赋能智能体:Palantir Foundry本体工程如何构建企业级AI的“可编程数字孪生” 摘要: 随着大语言模型(LLM)驱动的智能体(AI Agent)成为企业数字化的核心驱动力,传统的数据基础设施面临“可行动性”和“可信赖度”的挑战。Palantir Foundry的本体论(Ontology)
阅读全文
Palantir 的“本体工程”的核心思路、技术架构与实践示例
摘要:引言:为什么“本体工程”在当下越来越被强调? 在 AI+业务落地的浪潮中,很多团队一开始聚焦于模型(LLM、对话模型、检索模型等)、Prompt 设计、上下文检索(RAG)等技术维度。但在真实的企业环境里,落地 AI 的难点往往在于: 多源异构数据如何统一语义、对齐一致的业务视图 不同系统/流程/模
阅读全文
数据策略与模型算法
摘要:数据工程师:更多关心「基建」的问题,比如,数据链路如何构建、如何做技术选型、效率稳定性如何保障等等。 算法工程师:更多关心「模型」的问题,比如,具体某个算法是什么原理,如何调参等等。 数据分析师:运用工具解决「端到端」的问题,包括「问题抽象」、「业务洞见」、「讲故事」以及经济学、心理学的一些方法论和
阅读全文
如何将代码文本切成多个部分,方便大模型理解和RAG应用
摘要:当然。将代码文本有效地切分成多个部分(Chunking)对于 RAG(检索增强生成)和大模型理解至关重要,因为它直接影响到检索的准确性和模型处理信息的质量。代码不同于自然语言,它有**严谨的结构**(语法、依赖关系、块状作用域)和**多种抽象层级**(项目、模块、类、函数、单行代码)。因此,不能简单
阅读全文
OpenAI企业文化
摘要:OpenAI非常由下而上,尤其是在研究领域。我刚来的时候,开始询问下个季度的路线图。我得到的答案是:“这东西不存在”(虽然现在有了)。好的想法可以来自任何地方,而且事先往往并不清楚哪些想法会最有成效。进展不是来自一个宏伟的“总体规划”,而是迭代式的,随着新研究成果的出现而逐步揭示。得益于这种由下而上
阅读全文
Agent相关思考
摘要:Agent:搭建任务结构,能精确地引导模型做事在有明确的 context 和清晰的任务范围时,Agent 已经能处理很复杂的任务了,可一旦任务变得模糊、需要探索环境或迭代开发,Agent 就开始吃力人类是可以做到在工作中学习的,如果能让模型在真实世界中学习,而不是人类需要花几十亿收集每个具体任务的数
阅读全文
浙公网安备 33010602011771号