2025 年 3月 26 日随笔档案 - 华为云开发者联盟

2025年3月26日

摘要：摘要：RFT强化微调是一种新型LLM微调方法，通过强化学习与传统微调结合，少量数据即可显著增强领域场景的模型能力。本文分享自华为云社区《医疗场景实战|百条数据RFT微调盘古大模型，效果超越DS》，作者：盘古大模型官方账号。医疗场景实战|百条数据RFT微调盘古大模型，效果超越DS 2024年以来，阅读全文

posted @ 2025-03-26 16:03 华为云开发者联盟阅读(261) 评论(0) 推荐(0)

公告