belfastqiu

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2025年7月21日

摘要: 1.Chat Template '1. 指令微调在预训练(LoRA微调)之后' # 预训练使大模型成为“领域专家” # 指令微调令大模型学会表达 每一个大模型的指令微调都不一样; 所以一定要根据官方发布的格式做指令微调 '2. Chat_Template的源代码' # Chat_Template.p 阅读全文
posted @ 2025-07-21 19:56 Belfast_Qiu 阅读(53) 评论(0) 推荐(0)

摘要: 1.分组 '1. 两种训练方法' 从零开始预训练:BV1xhYtewEum 4分30秒 二次特定预训练:BV1xhYtewEum 2.创建LLM '1. 创建模型核心流程' (1)加载模型->(2)将模型放入显卡->(3)输入文本并分词-> (4)将分词放入显卡->(5)设置label->(6)模型 阅读全文
posted @ 2025-07-21 17:16 Belfast_Qiu 阅读(78) 评论(0) 推荐(0)