向着朝阳 - 博客园

2026年1月6日

摘要：目录Case 1：纯咨询 → 顺带销售（低干扰）对话触发结构映射系统行为示例响应逻辑Case 2：对比 + 犹豫 → 促成倾向对话触发结构映射系统行为示例响应逻辑Case 3：购买意图出现 → 推动成交对话触发结构映射系统行为示例响应逻辑Case 4：售后问题 → 保留复购机会对话触发结构映射系统行阅读全文

posted @ 2026-01-06 17:44 向着朝阳阅读(9) 评论(0) 推荐(0)

状态机 + 冷却机制

摘要：目录一、问题本质二、核心概念1️⃣ 股票状态2️⃣ 触发条件3️⃣ 冷却/重置策略a. 时间冷却b. 条件重置三、动态状态更新流程（伪代码）四、斜率动态变化处理五、工程实现建议六、总结设计思路明白，你现在关注的核心是 “预警状态管理” 和 “告警去重 / 冷却机制”，这是典型的工程问题，而不仅是指阅读全文

posted @ 2026-01-06 17:12 向着朝阳阅读(13) 评论(0) 推荐(0)

试探性建仓量化规则

摘要：目录试探性建仓预警规则（工程化版 V0）一、规则整体架构层级顺序二、规则细节1️⃣ 长期趋势过滤（Trend Gate）2️⃣ 波动分类（Volatility Class）方案 A：V0（数据不足时使用结构性代理）方案 B：V1（数据足够时，推荐逐步替换为基于价格行为的波动指标）3️⃣ 短期均线结构阅读全文

posted @ 2026-01-06 17:05 向着朝阳阅读(43) 评论(0) 推荐(0)

智能销售助手-Awareness阶段- 插槽设计

摘要：目录Case 1：纯咨询 → 顺带销售（低干扰）对话触发结构映射系统行为示例响应逻辑一、设计思路二、把你的话拆成“真实运行链路”Step 1：输入Step 2：标签准备（不是实时生成）用户侧（极简）SKU 侧（离线配置）Step 3：标签匹配（规则，不是 LLM）Step 4：选择插槽（受控枚举）S 阅读全文

posted @ 2026-01-06 16:12 向着朝阳阅读(10) 评论(0) 推荐(0)

2026年1月5日

为什么 LoRA 微调“越训练，输出越接近标注数据”

摘要：目录一、一句话总解释（先给结论）二、把“标注数据 → loss → 梯度 → 参数更新”连成一条因果链1️⃣ 标注数据定义了“什么是对的”2️⃣ loss 把“错多少”量化出来3️⃣ 梯度 (\frac{\partial L}{\partial W}) 回答一个关键问题4️⃣ 参数更新一定是“让 l 阅读全文

posted @ 2026-01-05 23:08 向着朝阳阅读(49) 评论(0) 推荐(0)

在transformer架构里面前向传播和反向传播-lora gradient checkpoint 优化

摘要：目录1. Transformer 的基本结构回顾2. 前向传播在 Transformer 中的执行3. 反向传播在 Transformer 中的执行4. 哪些层执行前向/反向传播图例Transformer Block 文本示意开启 Gradient Checkpoint 后（节省显存）好的，我们把阅读全文

posted @ 2026-01-05 20:58 向着朝阳阅读(115) 评论(0) 推荐(0)

QWEN 14B LoRA微调需要多少显存

摘要：目录2k上下文，在推理阶段如何支持更长的上下文面试回答一、标准高分回答（30 秒版）二、如果面试官追问「你怎么估的？」三、如果面试官再追问「为什么不是 LoRA 就很省？」四、不同水平回答对比（你要站在哪一档）❌ 初级（容易被刷）⚠️ 中级（用过，但不稳）✅ 高级（工程可落地）五、如果是偏工程 / 阅读全文

posted @ 2026-01-05 20:29 向着朝阳阅读(194) 评论(0) 推荐(0)

lora微调，如果不考虑 int4/8 量化，微调后会降低显存占用吗

摘要：目录1️⃣ LoRA 微调的基本机制2️⃣ 显存占用分析3️⃣ 小结 LoRA 微调本身不改变原模型大小，但通过只更新低秩参数，训练时显存需求大幅下降（全参数微调相比，显存需求少很多）；推理时显存变化不明显，量化是额外手段，不是必需。 1️⃣ LoRA 微调的基本机制 LoRA 的核心公式：原模型阅读全文

posted @ 2026-01-05 16:41 向着朝阳阅读(80) 评论(0) 推荐(0)

loRA微调loss异常情况分析

摘要：目录LoRA 参数 vs Loss 行为速查表（文本版） loss 下降太慢 → 先检查 r / α / target_modules / dropout 是否偏小 loss 震荡或发散 → 先检查 α / r、lr、r 是否偏大，同时看 target_modules 是否过多验证 loss 振荡阅读全文

posted @ 2026-01-05 15:54 向着朝阳阅读(110) 评论(0) 推荐(0)

Lora lr超参设置

摘要：目录二、什么时候还是要考虑调 lr一、lr 是什么（一句话）二、在 LoRA 场景下，lr 实际控制什么三、设置为多少“合适”（直接用）✅ 推荐安全区（90% 场景）按场景更精细的建议四、什么时候 lr 设“错了”lr 太大，典型表现lr 太小，典型表现 lr 太大，典型表现 loss 上下剧烈震荡阅读全文

posted @ 2026-01-05 15:23 向着朝阳阅读(96) 评论(0) 推荐(0)

aibi1

公告