摘要:
摘要:RFT强化微调是一种新型LLM微调方法,通过强化学习与传统微调结合,少量数据即可显著增强领域场景的模型能力。 本文分享自华为云社区《医疗场景实战|百条数据RFT微调盘古大模型,效果超越DS》,作者:盘古大模型官方账号。 医疗场景实战|百条数据RFT微调盘古大模型,效果超越DS 2024年以来, 阅读全文
posted @ 2025-03-26 16:03
华为云开发者联盟
阅读(261)
评论(0)
推荐(0)
浙公网安备 33010602011771号