2025年7月21日
摘要: 前言 最近大半年的时间,我基本都泡在大模型的RLHF 训练里,反复跑了很多轮实验。这个过程中,遇到了各种各样的问题和现象,光看论文理论往往不够,很多时候还是要靠实际调试来解决。我把这段时间踩过的坑、网上查到的资料以及自己摸索总结出来的一些调参思路和解决方案整理了一下。下边就分享给大家,希望能给同样在 阅读全文
posted @ 2025-07-21 15:03 风生水起 阅读(101) 评论(0) 推荐(0)
摘要: Normal 0 7.8 磅 0 2 false false false EN-US ZH-CN X-NONE 在信息学奥赛(尤其是NOI系列比赛)中,矩阵乘法并不是简单地“算两个矩阵相乘”,而是作为一种高效工具来解决以下几类经典问题: ✅ 1. 线性递推加速(矩阵快速幂) 典型题目:斐波那契数列第 阅读全文
posted @ 2025-07-21 14:50 风生水起 阅读(28) 评论(0) 推荐(0)