DeepSeek的线上面试 —— DPO为什么用KL散度,不用交叉熵? 机器学习中什么时候必须用KL散度,什么时候必须用交叉熵,什么时候二者可互换
Angry_Panda 2025-02-10 15:03
阅读:894
评论:0
推荐:0
我的随笔
神经网络:计算初始化权重时的 增益因子(gain factor) —— nn.init.calculate_gain
Angry_Panda 2025-02-10 12:17
阅读:118
评论:0
推荐:0
DeepSeek:AOE时间换算
Angry_Panda 2025-02-10 11:29
阅读:4227
评论:0
推荐:0
【转载】aoe时间与北京时间换算
Angry_Panda 2025-02-10 09:30
阅读:2278
评论:0
推荐:0
DeepSeek生成:博士毕业留大连,市政府给多少补贴
Angry_Panda 2025-02-09 20:51
阅读:488
评论:0
推荐:0
鹤童鹿童只是两个选错导师还被延毕的研究生罢了
Angry_Panda 2025-02-09 10:24
阅读:97
评论:0
推荐:0
IJCNN 2025可以不可以远程参会?
Angry_Panda 2025-02-08 17:49
阅读:824
评论:0
推荐:0
CCF会议审稿 —— Enter the limit if you can only review a limited number of paper
Angry_Panda 2025-02-06 12:24
阅读:24
评论:0
推荐:0
python报错:raise Exception('ROM is missing for %s, see https://github.com/openai/atari-py#roms for instructions
Angry_Panda 2025-02-05 19:47
阅读:29
评论:0
推荐:0
python报错:moviepy.editor
Angry_Panda 2025-02-05 14:25
阅读:158
评论:0
推荐:0
浙公网安备 33010602011771号