摘要:
DeepSeek-R1 模型微调系列 DeepSeek-R1 模型微调系列一. 前言介绍本文内容:1.1 项目背景1.2 LoRA和 QLoRA 简介1.3 LLaMA 架构和 Qwen 架构LLaMA 架构Qwen 架构二. 环境准备2.1 Unsloth 安装(显卡版本-暂时不用)2.2 创建P 阅读全文
posted @ 2025-02-12 15:15
宁采臣open
阅读(2645)
评论(2)
推荐(2)
浙公网安备 33010602011771号