10 2023 档案

LLM资料整理
摘要:框架: 1、https://github.com/LianjiaTech/BELLE 支持Docker 2、https://github.com/vllm-project/vllm 3、https://github.com/hiyouga/LLaMA-Factory/ 一个训练框架,比起BELLE来 阅读全文

posted @ 2023-10-29 17:39 穷酸秀才大草包 阅读(275) 评论(0) 推荐(0)

Pink Noise Is All You Need: Colored Noise Exploration in Deep Reinforcement Learning
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Published as a conference paper at ICLR 2023 ABSTRACT 在具有连续动作空间的异策深度强化学习中,探索通常通过在动作选择过程中注入动作噪声来实现。基于随机策略的流行算法,如SAC或MPO, 阅读全文

posted @ 2023-10-01 10:58 穷酸秀才大草包 阅读(415) 评论(0) 推荐(0)

导航