Fork me on GitHub
摘要: 如何蒸馏 Deepseek-R1 深度学习模型已经彻底改变了人工智能领域,但其庞大的规模和计算需求可能成为现实世界应用的瓶颈。模型蒸馏是一种强大的技术,通过将知识从大型复杂模型(教师)转移到较小、更高效的模型(学生)来解决这一挑战。 在这篇博客中,这里将介绍如何使用 LoRA (Low-Rank A 阅读全文
posted @ 2025-02-06 17:00 石头木 阅读(6342) 评论(0) 推荐(2)