摘要:
目录什么是语义漂移一、场景概览二、原始情况(语义清晰)用户问题:知识库文档:Embedding 空间三、知识库扩展后(语义漂移开始)新增文档:发生的变化检索结果LLM 回答效果四、为什么叫“语义漂移”五、如何面试描述一、MiniLM 在标签化中的作用二、为什么不能完全替代人工或规则1. 语义模糊 / 阅读全文
posted @ 2026-01-07 20:35
向着朝阳
阅读(93)
评论(0)
推荐(0)
摘要:
目录一、解码器的基本原理(面试口径)1️⃣ 和编码器相同的地方2️⃣ 和编码器不同的地方3️⃣ 推理时的特殊设计 “解码器在自注意力上做了遮蔽(mask),保证每个位置只能看到之前生成的 token,同时通过交叉注意力引入编码器输出,使生成能依赖源输入。” 一、解码器的基本原理(面试口径) “Tra 阅读全文
posted @ 2026-01-07 17:22
向着朝阳
阅读(22)
评论(0)
推荐(0)
摘要:
目录一、策略框架(你提的方案)二、策略优化建议1️⃣ 买入信号优化2️⃣ 减仓信号优化3️⃣ 风险控制三、策略优劣分析四、执行心智模型 完全可以,这套策略本质上是用短均线交叉 + 动态趋势拐头来做短线爆发股管理,非常符合 SanDisk 这种中盘、短期波动强的股票 的特性。 我帮你把你描述的策略整理 阅读全文
posted @ 2026-01-07 17:01
向着朝阳
阅读(69)
评论(0)
推荐(0)
摘要:
目录 好的,我给你整理一份 vLLM 推理加速优化清单,在原有表格基础上增加 “优先级 / 必做场景” 列,方便工程判断每个优化手段是否必须做以及在什么场景下可选。 优化名称 原理 / 作用 优先级 / 必做场景 KV Cache Transformer 注意力的 Key/Value 缓存。避免重复 阅读全文
posted @ 2026-01-07 16:46
向着朝阳
阅读(59)
评论(0)
推荐(0)
摘要:
目录1️⃣ 模型本质差异2️⃣ 适合场景对比MiniLM 小模型适合:Qwen 0.5B / 1.5B 小模型适合:3️⃣ 工程化选型建议 明白,你想比较 MiniLM 小分类模型和 Qwen 0.5B / 1.5B 小模型在项目里的使用场景差异,我给你做一个系统性分析。 1️⃣ 模型本质差异 特性 阅读全文
posted @ 2026-01-07 15:12
向着朝阳
阅读(64)
评论(0)
推荐(0)
摘要:
目录识别具体方案一、总体设计原则(工程版)1️⃣ 不要“LLM 全吃”也不要“规则全吃”二、Intent:复杂 → LLM,简单 → 规则兜底Intent 的特点推荐方案具体落地三、Phase:规则优先,LLM 兜底(非常重要)Phase 的特点推荐方案(强烈)示例四、Objection:高价值、高 阅读全文
posted @ 2026-01-07 13:13
向着朝阳
阅读(20)
评论(0)
推荐(0)
摘要:
目录一句话结论(先给你定性)一、先把概念彻底拆清楚(避免混)二、Action 到底是什么?(这是关键)Action = 系统需要立即执行的操作类型三、Action 识别,用规则还是模型?——分层设计第一层:规则(Rule Engine)——必须要有典型规则 Action第二层:小模型分类(MiniL 阅读全文
posted @ 2026-01-07 13:02
向着朝阳
阅读(8)
评论(0)
推荐(0)
摘要:
目录一、先给核心结论(先立规则)二、最关键的分水岭:第一根放量阳线之后的 48 小时1️⃣ 成交量结构(不是大小,是“怎么走”)❌ 2–3 天就死的股票✅ 能涨 1–2 周的股票2️⃣ 回调方式(这是最容易被忽略、但最有效的)❌ 短命拉升✅ 可持续上涨3️⃣ VWAP & EMA 的“站得住”能力❌ 阅读全文
posted @ 2026-01-07 11:41
向着朝阳
阅读(100)
评论(0)
推荐(0)
摘要:
目录一、两条选股路径的本质差异路径一:小市值 / 新资产的“爆发式成长”路径二:大市值公司的“趋势再定价”二、第二条路径的底层逻辑(非常关键)三、第二条路径的 4 个必要条件(缺一不可)条件 1:盈利预期发生“斜率变化”条件 2:业务结构出现“非线性放大器”条件 3:估值处于“可扩张区间”条件 4: 阅读全文
posted @ 2026-01-07 11:15
向着朝阳
阅读(21)
评论(0)
推荐(0)

浙公网安备 33010602011771号