feibo2011 - 博客园

摘要：

dppo、drpo、ode、sde、flowmatching算法任务背景：强化学习（Reinforcement Learning, RL）、大模型、多模态算法： dppo drpo ode sde flowmatching 1、听懂迭代后算法 2、概念得懂总结与关联性概念核心思想典型阅读全文

posted @ 2025-07-20 23:30 feibo2011 阅读(250) 评论(0) 推荐(0)

摘要：

posted @ 2019-11-06 11:30 feibo2011 阅读(2) 评论(0) 推荐(0)

摘要：

## hello world hello world 阅读全文

posted @ 2025-07-02 20:18 feibo2011 阅读(4) 评论(0) 推荐(0)

摘要：

posted @ 2019-11-06 11:33 feibo2011 阅读(214) 评论(0) 推荐(0)