大模型开发 - 随笔分类 - 向着朝阳

行为特征

摘要：目录第一大类：隐式反馈行为（Implicit Feedback）—— 系统的基石第二大类：显式反馈行为（Explicit Feedback）—— 高质量的信号第三大类：序列行为特征（Sequence Behavior）—— 现代大厂的杀手锏为什么行为特征比“用户画像”更准？（核心本质）总结在推荐系阅读全文

posted @ 2026-03-20 08:39 向着朝阳阅读(3) 评论(0) 推荐(0)

DNN和DIN输出维度多少合适

摘要：目录第一部分：总起（定基调）第二部分：分述 DNN 双塔（召回阶段）第三部分：分述 DIN（精排阶段）第四部分：总结升华（展现高级方法论）面试官问这个问题，绝对不是想听一个死记硬背的数字（比如“64维”）。他们真正想考察的是：你是否清楚召回（DNN双塔）和精排（DIN）在工程架构上的核心差异。阅读全文

posted @ 2026-03-19 08:26 向着朝阳阅读(3) 评论(0) 推荐(0)

用户塔embeding矩阵组成

摘要：目录特征向量类型1. 离散特征（Discrete / Categorical Features）2. 连续特征（Continuous / Dense Features）特征向量如何拼接成 DDN塔向量1. 离散特征（Sparse Features） -> 转化为 Embedding 向量2. 连续特阅读全文

posted @ 2026-03-19 08:10 向着朝阳阅读(3) 评论(0) 推荐(0)

在agent内部是否基于用户旅程做不同的逻辑处理？

摘要：目录1. 为什么 Agent 内部还需要区分旅程？2. Agent 内部基于微观旅程的逻辑分层（实战设计）阶段 A：初入评估期（信息获取阶段）阶段 B：深入评估期（对比与匹配阶段）阶段 C：评估期尾声（顾虑与临门一脚阶段）3. 工程上如何实现这种内部逻辑切换？总结绝对需要！这是一个非常高阶且切中要阅读全文

posted @ 2026-03-18 21:29 向着朝阳阅读(3) 评论(0) 推荐(0)

导购机器人设计

摘要：目录一、对当前 Agent 划分的改进建议1. 探索/推荐 Agent（负责“从 0 到 1”的广度搜索）2. 导购/对比 Agent（负责“从 1 到 1”的深度钻研）二、用户旅程如何与多 Agent 架构结合？1. 定义用户旅程的四个核心阶段2. 改造“协调者 Agent (Coordina 阅读全文

posted @ 2026-03-18 08:37 向着朝阳阅读(2) 评论(0) 推荐(0)

推荐系统-用户塔-embeding矩阵训练

摘要：目录第一步：为每个特征准备独立的 Embedding 矩阵第二步：User 塔的前向传播（把特征变成向量）第三步：计算损失（Loss）—— 训练的指挥棒第四步：反向传播，更新 Embedding（核心！）总结与工程经验建议矩阵的维度如何确定1. 核心原则：杀鸡不用牛刀（防止过拟合与浪费）2. 工业界阅读全文

posted @ 2026-03-17 22:35 向着朝阳阅读(12) 评论(0) 推荐(0)

双塔模型工作

摘要：目录问题 1：静态特征走普通的 Embedding，用的什么 Embedding 模型？问题 2：最终拿到 256 维 User Vector，去 Milvus 去召回吗？1. 离线/近线准备（Item 塔的工作）2. 在线实时召回（User 塔与 Milvus 的配合）💡 面试加分项（展现高级开阅读全文

posted @ 2026-03-17 08:40 向着朝阳阅读(3) 评论(0) 推荐(0)

推荐系统-双塔模型-进阶

摘要：目录1. 经典基线：DSSM (Deep Structured Semantic Model)2. 引入实时序列：YouTube DNN (召回版) / SASRec3. 解决“既要又要”：多兴趣召回模型 (MIND / ComiRec)4. 引入图网络：GraphSage / PinSage工业界阅读全文

posted @ 2026-03-17 08:23 向着朝阳阅读(14) 评论(0) 推荐(0)

推荐系统实现思路

摘要：目录设计思路V1.0 时代：你的抽象（基于规则和配置表）V2.0 时代：AI高级开发的抽象（基于模型与算法）1. 输入层（Input）：特征工程的实时化2. 大脑层（Processing）：从“查表”变成“模型打分”3. 输出层（Output）：AI Agent 动态生成总结特征向量设计和召回一、阅读全文

posted @ 2026-03-16 23:03 向着朝阳阅读(21) 评论(0) 推荐(0)

深度学习分支

摘要：目录深度学习的主要应用方向1️⃣ 计算机视觉（Computer Vision, CV）2️⃣ 语音处理（Speech AI）3️⃣ 多模态（Multimodal）4️⃣ 推荐系统5️⃣ 强化学习（RL）6️⃣ 科学与工业领域核心认知（重要）是的，而且不止视觉处理。你要区分清楚两个维度：深度学习阅读全文

posted @ 2026-02-07 17:47 向着朝阳阅读(15) 评论(0) 推荐(0)

AI技术+短剧

摘要：目录先拆解这个岗位的核心要求，帮你看清「门槛在哪、你的优势在哪、补什么就行」关键结论：这个岗位的「门槛」是AI技术+短剧行业认知，而非「创作能力」，对你是低适配成本快速适配的3个核心动作（1-2周就能落地，能直接写进简历/面试展示）1. 选准多模态工具，深耕「技术落地」而非创作（不用全学，精2个就够阅读全文

posted @ 2026-01-22 11:15 向着朝阳阅读(93) 评论(0) 推荐(0)

RAG-准确度提升之-前置过滤（3）-A/B测试 T_MULTI / T_MIN / K_MAX微调

摘要：目录一、总体原则（先说清楚，避免踩雷）二、实验分层设计（这是关键）1️⃣ 实验单元2️⃣ 只做「单变量 + 小范围」实验❌ 不要这样✅ 正确方式（推荐顺序）三、具体 A/B 方案设计（可直接用）阶段 1：T_MIN 主锚点阈值实验实验桶设计核心假设阶段 2：K_MAX 语义发散实验阶段 3：T_MU 阅读全文

posted @ 2026-01-13 08:20 向着朝阳阅读(10) 评论(0) 推荐(0)

RAG 二路召回（向量召回+ES）

摘要：目录一、结论先行（非常重要）但它出现的原因，不是为了提升“整体准确率”，而是为了兜住向量检索天然不擅长的那一类 query。二、你当前方案的能力边界这个架构非常合理，但它天然有 4 个盲区。三、向量检索的 4 类“硬伤场景”1️⃣ 精确词 / 结构化信息查询（ES 擅长）2️⃣ 否定 / 对比 / 阅读全文

posted @ 2026-01-13 07:46 向着朝阳阅读(40) 评论(0) 推荐(0)

RAG-准确度提升之-前置过滤-向量召回法-持续改进

摘要：目录一、先给你一个总判断（非常重要）二、持续提升准确度的 5 条“硬机制”1️⃣ 用「路由原因」反推哪里不准（最关键）你应该长期看什么？2️⃣ 只用 LLM 失败样本，反向喂给 MiniLM（闭环）闭环流程（强烈推荐）一、整体思路二、数据集结构（最标准的格式）1️⃣ 基本样式（JSON / CSV 阅读全文

posted @ 2026-01-12 19:52 向着朝阳阅读(17) 评论(0) 推荐(0)

Milvus 的ANN（Approximate Nearest Neighbor）算法

摘要：目录一、Milvus 支持的 ANN 算法概览二、算法特点对比（工业级参考）三、选型参考四、Milvus ANN 使用流程简述五、总结一句话明白，你想深入 Milvus 的ANN（Approximate Nearest Neighbor）算法实现细节。下面我帮你梳理得工业级完整、直接可落地理解：阅读全文

posted @ 2026-01-12 17:19 向着朝阳阅读(10) 评论(0) 推荐(0)

embeding模型选择

摘要：目录【结论】高性能，语义不太复杂的场景 -选择MiniLM 6L/12L. 12L是12层的意思中等性能，中等意义复杂度选择 - Sentence-BERT 语义很复杂：Qwen-embedding-large 或者 ext-embedding-3-large（效果更好，但是更贵）向量化算法阅读全文

posted @ 2026-01-12 16:37 向着朝阳阅读(49) 评论(0) 推荐(0)

RAG-准确度提升之-前置过滤-向量召回法

摘要：目录一、补全后的完整伪代码（可直接工程化）二、这套规则“在系统里到底干了什么？”整体一句话决策流程图（文字版）每一步解决的“真实问题”三、关键变量定义 & 推荐取值（你可以直接写进配置）1️⃣ TOP_K2️⃣ T_MULTI（是否参与）3️⃣ T_MIN（是否可信）4️⃣ K_MAX（语义是否发散阅读全文

posted @ 2026-01-10 07:45 向着朝阳阅读(24) 评论(0) 推荐(0)

RAG 不同场景相识度设置

摘要：目录1️⃣ 场景差异：去重 vs 意图缓存2️⃣ 为什么意图分类要求更高相似度3️⃣ 总结你提到的这个差异非常典型，也是很多做 RAG + 意图分类缓存的人容易困惑的地方：为什么文档去重 / 聚类用 0.85~0.9 就够了，但意图分类缓存却要求 0.95~0.98？我们可以从本质原因来分析： 1 阅读全文

posted @ 2026-01-09 18:44 向着朝阳阅读(15) 评论(0) 推荐(0)

标签化处理方案

摘要：目录刚上线成熟业务增强方案 - 小模型改成 -- 2个小模型投票2个小模型投票 “‘通用大模型做冷启动’意思是：当新业务、长尾场景或数据缺乏时，我们用大模型对这些新 query 或文档进行自动标签或实体抽取，再经人工复核生成训练集，微调小模型上线。这样可以在最短时间内让小模型覆盖新业务，实现系统快速阅读全文

posted @ 2026-01-08 08:07 向着朝阳阅读(22) 评论(0) 推荐(0)

RAG 语义漂移解决

摘要：目录什么是语义漂移一、场景概览二、原始情况（语义清晰）用户问题：知识库文档：Embedding 空间三、知识库扩展后（语义漂移开始）新增文档：发生的变化检索结果LLM 回答效果四、为什么叫“语义漂移”五、如何面试描述一、MiniLM 在标签化中的作用二、为什么不能完全替代人工或规则1. 语义模糊 / 阅读全文

posted @ 2026-01-07 20:35 向着朝阳阅读(86) 评论(0) 推荐(0)

aibi1

随笔分类 - 大模型开发

公告