会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
aibi1
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
21
22
23
24
25
26
27
28
29
···
81
下一页
2026年1月2日
智能体Agent Intent设计
摘要: 目录一、Intent 设计的核心原则1️⃣ 以用户认知/心理状态为核心2️⃣ Intent 应该可判定3️⃣ Intent 与系统动作解耦4️⃣ Intent 数量最小化(Minimum Viable Intent)5️⃣ Intent 要易于工程路由6️⃣ Intent 要和可衡量指标挂钩7️⃣
阅读全文
posted @ 2026-01-02 10:44 向着朝阳
阅读(39)
评论(0)
推荐(0)
2026年1月1日
趋势增强和回撤组合投资法-纳斯达克
摘要: 目录50 万纳指资金 – 细化操作策略1️⃣ 趋势增强策略(波段操作)操作步骤2️⃣ 回撤投资法(支撑低吸)操作步骤3️⃣ 现金管理(保留灵活资金)4️⃣ 综合仓位示意(50 万总资金)5️⃣ 执行原则总结 明白,你希望把之前的概念性操作策略细化成具体、可执行的操作步骤,针对你的 50 万纳指资金
阅读全文
posted @ 2026-01-01 22:34 向着朝阳
阅读(118)
评论(0)
推荐(0)
基于趋势增强的投资法-纳斯达克
摘要: 目录一、使用“多重 EMA + 动态止盈”组合二、价格结构 + 回调确认三、动态仓位管理四、核心思想总结 明白,你希望趋势增强策略更灵敏,尤其是在高 PE 纳指环境下,想尽量提前捕捉上涨波段,同时不过早出场。我们可以在不加复杂指标、不用期权的前提下,把策略优化得更灵敏。下面是几个可行方法: 一、使用
阅读全文
posted @ 2026-01-01 22:07 向着朝阳
阅读(84)
评论(0)
推荐(0)
纳指回撤投资法
摘要: 目录高 PE 环境回撤策略 —— 一页式执行清单(A4)一、先判断:今天“能不能动手”(30 秒完成)二、仓位表(只按表执行,不临时改)三、止损规则(必须提前接受)单次建仓止损策略级止损四、卖出规则(比买入更重要)分段止盈(不等顶部)趋势例外(少量允许)五、年底结算(只看这 3 个问题)六、三条“写
阅读全文
posted @ 2026-01-01 15:50 向着朝阳
阅读(73)
评论(0)
推荐(0)
支持微调的大模型和不支持微调的解决方案
摘要: 目录大模型OPENAPI Gemini等不支持微调的大模型如何适配垂直场景本质特点方案二(效果最稳定):模型外置判别器(Hybrid)架构方案三(非常重要):蒸馏(Distillation)做法这是当前业界事实上的标准路径 大模型 【总结】 如果一个 Qwen 模型是官方发布、但 权重未开源 的版本
阅读全文
posted @ 2026-01-01 10:18 向着朝阳
阅读(37)
评论(0)
推荐(0)
大模型蒸馏
摘要: 目录一、学生模型(LoRA 微调模型)选择二、教师生成训练数据(GPT / ChatGPT)技巧1️⃣ 指令设计2️⃣ 数据量控制3️⃣ 数据分布覆盖4️⃣ 多轮对话5️⃣ 校验与清洗三、训练注意事项四、常见坑与解决方案五、总结经验法则null一、相似点(为什么可以看作微调的分支)二、不同点(蒸馏独
阅读全文
posted @ 2026-01-01 10:17 向着朝阳
阅读(38)
评论(0)
推荐(0)
2025年12月31日
LORA NF4 量化原理
摘要: 目录1. 权重的“精度压缩”:从FP32→4位NF4,直接砍显存2. NF4的“适配性优化”:减少压缩后的精度损失3. “冻结主权重+仅训LoRA”:进一步省显存+保效果总结原理 这个“4位NF4量化+冻结主权重”能大幅减少显存的原理,本质是“精度压缩+计算分离”,可以拆成3个核心环节理解: 1.
阅读全文
posted @ 2025-12-31 11:43 向着朝阳
阅读(63)
评论(0)
推荐(0)
LoRA r跟数据量的关系
摘要: 目录r跟数据量的关系📌 样本量 vs 推荐 r(经验值)任务复杂度分级(工程视角)举例四、结合 target_modules 的“等效 r”换算(非常重要)五、你的场景下的“直接建议”(结合你之前背景)🎯 推荐组合(稳妥)六、一句话结论r和target_modules的关系 r跟数据量的关系 核
阅读全文
posted @ 2025-12-31 10:39 向着朝阳
阅读(20)
评论(0)
推荐(0)
LoRA训练的数据质量和数据量和任务复杂度关系
摘要: 目录一、核心结论(一句话)二、复杂度等级 × 训练数据关系总览(工程视角)📌 总表(建议收藏)三、逐级展开(重点在 L3 / L4)L1:风格 / 格式(数据量主导)L2:单意图(映射学习)L3:多意图 / 组合意图(这是你现在的重点)模型在学什么?❗ 这时数据量已经不是关键问题必须具备的数据结构
阅读全文
posted @ 2025-12-31 10:36 向着朝阳
阅读(28)
评论(0)
推荐(0)
LORA微调的参数选择-进阶
摘要: 目录概念任务复杂度r(秩)不同任务复杂度的训练的数据要求任务复杂度 × 样本量 × 结构化数据占比(经验参考)注释说明r(秩) 和训练数据量和 target_modules 关系一、回顾 r ≈ 任务复杂度 × log₁₀(样本数)二、target_modules 如何影响 r 的选择1️⃣ 定义2
阅读全文
posted @ 2025-12-31 10:04 向着朝阳
阅读(125)
评论(0)
推荐(0)
上一页
1
···
21
22
23
24
25
26
27
28
29
···
81
下一页
公告