聊一聊学习率预热linear warmup
风生水起 2023-07-26 15:14
阅读:545
评论:0
推荐:0
我的随笔
softmax和crossentropy
风生水起 2023-07-14 15:42
阅读:228
评论:0
推荐:0
Linux文件比较命令
风生水起 2023-07-12 21:34
阅读:270
评论:0
推荐:0
超级对齐简介zz
风生水起 2023-07-10 20:05
阅读:103
评论:0
推荐:0
grep常用命令
风生水起 2023-06-23 16:28
阅读:348
评论:0
推荐:0
Vim编辑器常用命令
风生水起 2023-06-23 16:25
阅读:413
评论:0
推荐:0
为什么RLHF中,PPO需要Critic模型而不是直接使用RewardModel
风生水起 2023-06-14 18:13
阅读:5776
评论:1
推荐:3
GPT问答记录
风生水起 2023-06-10 11:40
阅读:0
评论:0
推荐:0
大模型可视化
风生水起 2023-06-01 14:34
阅读:109
评论:0
推荐:0
RLHF
风生水起 2023-05-30 17:24
阅读:103
评论:0
推荐:0
浙公网安备 33010602011771号