随笔分类 - 大模型开发
摘要:目录1. 为什么 Agent 内部还需要区分旅程?2. Agent 内部基于微观旅程的逻辑分层(实战设计)阶段 A:初入评估期(信息获取阶段)阶段 B:深入评估期(对比与匹配阶段)阶段 C:评估期尾声(顾虑与临门一脚阶段)3. 工程上如何实现这种内部逻辑切换?总结 绝对需要!这是一个非常高阶且切中要
阅读全文
摘要:目录一、 对当前 Agent 划分的改进建议1. 探索/推荐 Agent(负责“从 0 到 1”的广度搜索)2. 导购/对比 Agent(负责“从 1 到 1”的深度钻研)二、 用户旅程如何与多 Agent 架构结合?1. 定义用户旅程的四个核心阶段2. 改造“协调者 Agent (Coordina
阅读全文
摘要:目录第一步:为每个特征准备独立的 Embedding 矩阵第二步:User 塔的前向传播(把特征变成向量)第三步:计算损失(Loss)—— 训练的指挥棒第四步:反向传播,更新 Embedding(核心!)总结与工程经验建议矩阵的维度如何确定1. 核心原则:杀鸡不用牛刀(防止过拟合与浪费)2. 工业界
阅读全文
摘要:目录问题 1:静态特征走普通的 Embedding,用的什么 Embedding 模型?问题 2:最终拿到 256 维 User Vector,去 Milvus 去召回吗?1. 离线/近线准备(Item 塔的工作)2. 在线实时召回(User 塔与 Milvus 的配合)💡 面试加分项(展现高级开
阅读全文
摘要:目录1. 经典基线:DSSM (Deep Structured Semantic Model)2. 引入实时序列:YouTube DNN (召回版) / SASRec3. 解决“既要又要”:多兴趣召回模型 (MIND / ComiRec)4. 引入图网络:GraphSage / PinSage工业界
阅读全文
摘要:目录设计思路V1.0 时代:你的抽象(基于规则和配置表)V2.0 时代:AI高级开发的抽象(基于模型与算法)1. 输入层(Input):特征工程的实时化2. 大脑层(Processing):从“查表”变成“模型打分”3. 输出层(Output):AI Agent 动态生成总结特征向量设计 和召回一、
阅读全文
摘要:目录深度学习的主要应用方向1️⃣ 计算机视觉(Computer Vision, CV)2️⃣ 语音处理(Speech AI)3️⃣ 多模态(Multimodal)4️⃣ 推荐系统5️⃣ 强化学习(RL)6️⃣ 科学与工业领域核心认知(重要) 是的,而且不止视觉处理。 你要区分清楚两个维度: 深度学习
阅读全文
摘要:目录先拆解这个岗位的核心要求,帮你看清「门槛在哪、你的优势在哪、补什么就行」关键结论:这个岗位的「门槛」是AI技术+短剧行业认知,而非「创作能力」,对你是低适配成本快速适配的3个核心动作(1-2周就能落地,能直接写进简历/面试展示)1. 选准多模态工具,深耕「技术落地」而非创作(不用全学,精2个就够
阅读全文
摘要:目录一、总体原则(先说清楚,避免踩雷)二、实验分层设计(这是关键)1️⃣ 实验单元2️⃣ 只做「单变量 + 小范围」实验❌ 不要这样✅ 正确方式(推荐顺序)三、具体 A/B 方案设计(可直接用)阶段 1:T_MIN 主锚点阈值实验实验桶设计核心假设阶段 2:K_MAX 语义发散实验阶段 3:T_MU
阅读全文
摘要:目录一、结论先行(非常重要)但它出现的原因,不是为了提升“整体准确率”,而是为了兜住 向量检索天然不擅长的那一类 query。二、你当前方案的能力边界这个架构非常合理,但它天然有 4 个盲区。三、向量检索的 4 类“硬伤场景”1️⃣ 精确词 / 结构化信息查询(ES 擅长)2️⃣ 否定 / 对比 /
阅读全文
摘要:目录一、先给你一个总判断(非常重要)二、持续提升准确度的 5 条“硬机制”1️⃣ 用「路由原因」反推哪里不准(最关键)你应该长期看什么?2️⃣ 只用 LLM 失败样本,反向喂给 MiniLM(闭环)闭环流程(强烈推荐)一、整体思路二、数据集结构(最标准的格式)1️⃣ 基本样式(JSON / CSV
阅读全文
摘要:目录一、Milvus 支持的 ANN 算法概览二、算法特点对比(工业级参考)三、选型参考四、Milvus ANN 使用流程简述五、总结一句话 明白,你想深入 Milvus 的ANN(Approximate Nearest Neighbor)算法实现细节。下面我帮你梳理得工业级完整、直接可落地理解:
阅读全文
摘要:目录 【结论】 高性能,语义不太复杂的场景 -选择MiniLM 6L/12L. 12L是12层的意思 中等性能,中等意义复杂度选择 - Sentence-BERT 语义很复杂:Qwen-embedding-large 或者 ext-embedding-3-large(效果更好,但是更贵) 向量化算法
阅读全文
摘要:目录一、补全后的完整伪代码(可直接工程化)二、这套规则“在系统里到底干了什么?”整体一句话决策流程图(文字版)每一步解决的“真实问题”三、关键变量定义 & 推荐取值(你可以直接写进配置)1️⃣ TOP_K2️⃣ T_MULTI(是否参与)3️⃣ T_MIN(是否可信)4️⃣ K_MAX(语义是否发散
阅读全文
摘要:目录1️⃣ 场景差异:去重 vs 意图缓存2️⃣ 为什么意图分类要求更高相似度3️⃣ 总结 你提到的这个差异非常典型,也是很多做 RAG + 意图分类缓存的人容易困惑的地方:为什么文档去重 / 聚类用 0.85~0.9 就够了,但意图分类缓存却要求 0.95~0.98?我们可以从本质原因来分析: 1
阅读全文
摘要:目录刚上线成熟业务增强方案 - 小模型改成 -- 2个小模型投票2个小模型投票 “‘通用大模型做冷启动’意思是:当新业务、长尾场景或数据缺乏时,我们用大模型对这些新 query 或文档进行自动标签或实体抽取,再经人工复核生成训练集,微调小模型上线。这样可以在最短时间内让小模型覆盖新业务,实现系统快速
阅读全文
摘要:目录什么是语义漂移一、场景概览二、原始情况(语义清晰)用户问题:知识库文档:Embedding 空间三、知识库扩展后(语义漂移开始)新增文档:发生的变化检索结果LLM 回答效果四、为什么叫“语义漂移”五、如何面试描述一、MiniLM 在标签化中的作用二、为什么不能完全替代人工或规则1. 语义模糊 /
阅读全文
摘要:目录识别具体方案一、总体设计原则(工程版)1️⃣ 不要“LLM 全吃”也不要“规则全吃”二、Intent:复杂 → LLM,简单 → 规则兜底Intent 的特点推荐方案具体落地三、Phase:规则优先,LLM 兜底(非常重要)Phase 的特点推荐方案(强烈)示例四、Objection:高价值、高
阅读全文
摘要:目录一句话结论(先给你定性)一、先把概念彻底拆清楚(避免混)二、Action 到底是什么?(这是关键)Action = 系统需要立即执行的操作类型三、Action 识别,用规则还是模型?——分层设计第一层:规则(Rule Engine)——必须要有典型规则 Action第二层:小模型分类(MiniL
阅读全文
摘要:目录一句话确认(可以当最终结论)一张心智模型(非常重要)三、为什么一定要这么设计(工程原因)1️⃣ 防止“SKU 反向主导话术”2️⃣ 模板数量被牢牢限制住3️⃣ 便于调销售“力度”四、那 SKU 标签到底干什么?(非常明确)SKU 标签示例(仍然是事实)五、一个完整最小例子(你现在这套的“黄金路径
阅读全文

浙公网安备 33010602011771号