LLaMA-Factory系列---【微调模型并使用ollama启动微调后的模型】

1.下载模型

1.1打开魔搭社区官网,找到你要微调的模型

按上面的图,复制模型clone命令,也可以直接下载所有文件到一个文件夹下。

# 打开LLaMa-Factory的下载根目录,执行下面的命令
git clone https://www.modelscope.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B.git

2.准备数据集

如果你要自己准备数据集,可以参考下面图中的示例的Alpaca格式,通过大模型帮助生成。

这里我就以魔搭社区的数据集为例,训练一个大模型。

下载好之后,丢到llama-factory的data目录下

在同目录下的dataset_info.json文件中配置huanhuan.json,不要把文件名写错了。

3.选择配置好的数据集开始训练

我用的英伟达1070 8G的,内存128G,训练1轮,跑了30分钟。

训练开始和完毕的快照如下:也可以看显卡监控,停下来了,就说明训练完了。

4.验证训练效果

来个更详细的截图

5.导出训练好的模型到指定目录

切换到Export功能

6.导入到ollama并启动模型

# cd到导出的指定目录,然后使用下面的命令手动导入到ollama的模型列表
ollama create custom_deepseek_r1_1.5b  -f Modelfile


ollama run custom_deepseek_r1_1.5b:latest

posted on 2025-09-11 00:55  少年攻城狮  阅读(108)  评论(0)    收藏  举报

导航