摘要: 摘要:RFT强化微调是一种新型LLM微调方法,通过强化学习与传统微调结合,少量数据即可显著增强领域场景的模型能力。 本文分享自华为云社区《医疗场景实战|百条数据RFT微调盘古大模型,效果超越DS》,作者:盘古大模型官方账号。 医疗场景实战|百条数据RFT微调盘古大模型,效果超越DS 2024年以来, 阅读全文
posted @ 2025-03-26 16:03 华为云开发者联盟 阅读(228) 评论(0) 推荐(0)