LLaMA-Factory系列---【微调模型并使用ollama启动微调后的模型】
1.下载模型
1.1打开魔搭社区官网,找到你要微调的模型
按上面的图,复制模型clone命令,也可以直接下载所有文件到一个文件夹下。
# 打开LLaMa-Factory的下载根目录,执行下面的命令
git clone https://www.modelscope.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B.git
2.准备数据集
如果你要自己准备数据集,可以参考下面图中的示例的Alpaca格式,通过大模型帮助生成。
这里我就以魔搭社区的数据集为例,训练一个大模型。
下载好之后,丢到llama-factory的data目录下
在同目录下的dataset_info.json文件中配置huanhuan.json,不要把文件名写错了。
3.选择配置好的数据集开始训练
我用的英伟达1070 8G的,内存128G,训练1轮,跑了30分钟。
训练开始和完毕的快照如下:也可以看显卡监控,停下来了,就说明训练完了。
4.验证训练效果
来个更详细的截图
5.导出训练好的模型到指定目录
切换到Export功能
6.导入到ollama并启动模型
# cd到导出的指定目录,然后使用下面的命令手动导入到ollama的模型列表
ollama create custom_deepseek_r1_1.5b -f Modelfile
ollama run custom_deepseek_r1_1.5b:latest
愿你走出半生,归来仍是少年!

浙公网安备 33010602011771号