LLaMA-Factory系列---【微调模型并使用ollama启动微调后的模型】

1.下载模型

按上面的图，复制模型clone命令，也可以直接下载所有文件到一个文件夹下。

# 打开LLaMa-Factory的下载根目录，执行下面的命令
git clone https://www.modelscope.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B.git

如果你要自己准备数据集，可以参考下面图中的示例的Alpaca格式，通过大模型帮助生成。

这里我就以魔搭社区的数据集为例，训练一个大模型。

下载好之后，丢到llama-factory的data目录下

在同目录下的dataset_info.json文件中配置huanhuan.json，不要把文件名写错了。

我用的英伟达1070 8G的，内存128G,训练1轮，跑了30分钟。

训练开始和完毕的快照如下：也可以看显卡监控，停下来了，就说明训练完了。

来个更详细的截图

切换到Export功能

# cd到导出的指定目录，然后使用下面的命令手动导入到ollama的模型列表
ollama create custom_deepseek_r1_1.5b  -f Modelfile


ollama run custom_deepseek_r1_1.5b:latest

posted on 2025-09-11 00:55 少年攻城狮阅读(523) 评论(0) 收藏举报

刷新页面返回顶部