摘要:
"deepseek面试被问懵了: DPO为什么用KL散度,不用交叉熵? 机器学习中什么时候必须用KL散度,什么时候必须用交叉熵,什么时候二者可互换?" 一位专注于算法的面试者向极速财讯分享了自己的经验,他主要从事TensorFlow/PyTorch相关的工作,涉及各种模型结构、复杂度以及分布式训练。 阅读全文
posted @ 2025-02-10 15:03
Angry_Panda
阅读(901)
评论(0)
推荐(0)
浙公网安备 33010602011771号