会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
石头木
https://jiangnanboy.github.io
博客园
首页
新随笔
联系
订阅
管理
2025年2月6日
如何蒸馏 Deepseek-R1
摘要: 如何蒸馏 Deepseek-R1 深度学习模型已经彻底改变了人工智能领域,但其庞大的规模和计算需求可能成为现实世界应用的瓶颈。模型蒸馏是一种强大的技术,通过将知识从大型复杂模型(教师)转移到较小、更高效的模型(学生)来解决这一挑战。 在这篇博客中,这里将介绍如何使用 LoRA (Low-Rank A
阅读全文
posted @ 2025-02-06 17:00 石头木
阅读(6342)
评论(0)
推荐(2)
公告