摘要:
打印一条推理路径 在上文中,我们跑通了rllm框架,下面,让我们仔细分析一下examples/math_tool/run_math_with_tool.py中的内部过程。 run_math_with_tool.py的大致代码如下: agent_args = {"tools": ["python"], 阅读全文
posted @ 2025-12-02 20:17
Brain404
阅读(90)
评论(0)
推荐(1)
摘要:
1. 什么是rllm rllm是伯克利开发的一个用于Agent RL的框架,基于verl开发,简单易上手,可以快速定义环境和工具,并一键运行。 2. 环境部署 作者在不拉docker镜像的前提下,尝试使用官方教程部署rllm,部署后,代码跑不通。 上网查了很多资料后,作者自己摸索出了一套流程,可以成 阅读全文
posted @ 2025-12-02 15:44
Brain404
阅读(39)
评论(0)
推荐(0)

浙公网安备 33010602011771号