2025 年 7月 20 日随笔档案 - feibo2011

摘要：

dppo、drpo、ode、sde、flowmatching算法任务背景：强化学习（Reinforcement Learning, RL）、大模型、多模态算法： dppo drpo ode sde flowmatching 1、听懂迭代后算法 2、概念得懂总结与关联性概念核心思想典型阅读全文

posted @ 2025-07-20 23:30 feibo2011 阅读(172) 评论(0) 推荐(0)