摘要: 凸函数,二阶导数检验:f''(x) > 0 意味着凸函数。 凸函数真正美妙之处在于,如果你在凸函数上取任意两点,并在它们之间画一条直线,这条线总是在曲线上方,永远不会低于曲线。 数学上:对于 0 到 1 之间的任意 λ,f(λx + (1-λ)y) ≤ λf(x) + (1-λ)f(y)。 曲线越“ 阅读全文
posted @ 2025-10-16 20:51 CathyBryant 阅读(23) 评论(0) 推荐(0)
摘要: 下面我们进入微调中最棘手、最活跃的部分之一:当模型开始出现问题迹象时,该怎么办?困惑度上升、损失函数震荡、过拟合,或者普遍感觉它“学错了东西”。 在某种程度上,这时训练不像雕塑,更像是园艺,修剪、调整、适量浇水。所有这些都不需要把植物拔掉再重新开始。 1. 学习率调整,倾听地形 最简单、最强大的杠杆 阅读全文
posted @ 2025-10-16 20:21 CathyBryant 阅读(8) 评论(0) 推荐(0)
摘要: 经过预训练后,模型的参数有数十亿个,它们形成了一个向量: \theta_0 \in \mathbb{R}^n 它编码了模型所学到的一切关于语言的知识:结构、语义、节奏。但这些权重是通用的,而非个性化的。模型此刻知道单词的含义,但不知道如何使用它们来表达善意、安全或清晰。 然后是有监督微调: \the 阅读全文
posted @ 2025-10-16 13:45 CathyBryant 阅读(12) 评论(0) 推荐(0)