会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
aibi1
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
14
15
16
17
18
19
20
21
22
···
81
下一页
2026年1月13日
RAG 二路召回(向量召回+ES)
摘要: 目录一、结论先行(非常重要)但它出现的原因,不是为了提升“整体准确率”,而是为了兜住 向量检索天然不擅长的那一类 query。二、你当前方案的能力边界这个架构非常合理,但它天然有 4 个盲区。三、向量检索的 4 类“硬伤场景”1️⃣ 精确词 / 结构化信息查询(ES 擅长)2️⃣ 否定 / 对比 /
阅读全文
posted @ 2026-01-13 07:46 向着朝阳
阅读(44)
评论(0)
推荐(0)
2026年1月12日
RAG-准确度提升之-前置过滤-向量召回法-持续改进
摘要: 目录一、先给你一个总判断(非常重要)二、持续提升准确度的 5 条“硬机制”1️⃣ 用「路由原因」反推哪里不准(最关键)你应该长期看什么?2️⃣ 只用 LLM 失败样本,反向喂给 MiniLM(闭环)闭环流程(强烈推荐)一、整体思路二、数据集结构(最标准的格式)1️⃣ 基本样式(JSON / CSV
阅读全文
posted @ 2026-01-12 19:52 向着朝阳
阅读(20)
评论(0)
推荐(0)
Milvus 的ANN(Approximate Nearest Neighbor)算法
摘要: 目录一、Milvus 支持的 ANN 算法概览二、算法特点对比(工业级参考)三、选型参考四、Milvus ANN 使用流程简述五、总结一句话 明白,你想深入 Milvus 的ANN(Approximate Nearest Neighbor)算法实现细节。下面我帮你梳理得工业级完整、直接可落地理解:
阅读全文
posted @ 2026-01-12 17:19 向着朝阳
阅读(17)
评论(0)
推荐(0)
意图识别小模型和embeding 模型选择
摘要: 目录一、总体判断(一句话)二、逐项评估你的选型1️⃣ 意图识别:MiniLM-12L(优先) + LLM 兜底为什么合适唯一提醒2️⃣ RAG embedding:Sentence-BERTSentence-BERT 的问题不在“准不准”三、为什么「MiniLM + Sentence-BERT」不是
阅读全文
posted @ 2026-01-12 17:13 向着朝阳
阅读(76)
评论(0)
推荐(0)
embeding模型选择
摘要: 目录 【结论】 高性能,语义不太复杂的场景 -选择MiniLM 6L/12L. 12L是12层的意思 中等性能,中等意义复杂度选择 - Sentence-BERT 语义很复杂:Qwen-embedding-large 或者 ext-embedding-3-large(效果更好,但是更贵) 向量化算法
阅读全文
posted @ 2026-01-12 16:37 向着朝阳
阅读(52)
评论(0)
推荐(0)
股票试单-加仓策略
摘要: 目录一、你当前这一步,在体系里叫什么?二、什么时候加仓(核心)原则一句话:三、推荐的加仓节奏(与你的 EMA 策略强匹配)第一档加仓:确认延续第二档加仓:结构确认第三档加仓(可选):趋势加速四、什么时候「不要」加仓(非常重要)五、减仓逻辑(一定要在买入时就想清楚)第一类减仓:趋势被破坏第二类减仓:获
阅读全文
posted @ 2026-01-12 07:58 向着朝阳
阅读(74)
评论(0)
推荐(0)
2026年1月10日
量化提醒后-人工确认信息
摘要: 目录一、事实层(先确认你的判断)二、那为什么我们仍然“坚持用日线收盘确认”?(关键)1️⃣ 盘中 EMA 上穿 ≠ 趋势成立2️⃣ 收盘确认 = 市场共识确认三、那在富途里应该怎么“实际操作”?(非常重要)✅ 正确实操流程(建议照这个来)Step 1:盘后筛选(核心)Step 2:盘后人工确认Ste
阅读全文
posted @ 2026-01-10 16:00 向着朝阳
阅读(21)
评论(0)
推荐(0)
MiniLM 分类器的使用场景
摘要: 目录四、工程结论一、MiniLM 训练成分类器做 RAG 前置过滤 不合适原因:二、MiniLM 训练成分类器做 意图识别 也不合适原因:三、总结对比表 四、工程结论 MiniLM 分类器只适合: 标签固定且互斥 单意图、高置信度场景 (不适合多意图识别的场景) 快速路由 / 拦截简单 query
阅读全文
posted @ 2026-01-10 08:19 向着朝阳
阅读(15)
评论(0)
推荐(0)
RAG-准确度提升之-前置过滤-向量召回法
摘要: 目录一、补全后的完整伪代码(可直接工程化)二、这套规则“在系统里到底干了什么?”整体一句话决策流程图(文字版)每一步解决的“真实问题”三、关键变量定义 & 推荐取值(你可以直接写进配置)1️⃣ TOP_K2️⃣ T_MULTI(是否参与)3️⃣ T_MIN(是否可信)4️⃣ K_MAX(语义是否发散
阅读全文
posted @ 2026-01-10 07:45 向着朝阳
阅读(26)
评论(0)
推荐(0)
MiniLM 微调成分类器和embedding + margin 不同用法
摘要: 目录一、模式对比二、核心区别总结三、选择建议更细节的区别一、专用分类器(模式 3)1️⃣ 思路2️⃣ Python 伪代码示例特点二、Embedding + Margin(方案 2)1️⃣ 思路2️⃣ Python 伪代码示例特点三、对比总结四、总结一句话什么情况下用margin一、你现在这一步在“
阅读全文
posted @ 2026-01-10 07:44 向着朝阳
阅读(31)
评论(0)
推荐(0)
上一页
1
···
14
15
16
17
18
19
20
21
22
···
81
下一页
公告