2025 年 7月 21 日随笔档案 - Belfast_Qiu

公告

2025年7月21日

摘要： 1.Chat Template '1. 指令微调在预训练（LoRA微调）之后' # 预训练使大模型成为“领域专家” # 指令微调令大模型学会表达每一个大模型的指令微调都不一样；所以一定要根据官方发布的格式做指令微调 '2. Chat_Template的源代码' # Chat_Template.p 阅读全文

posted @ 2025-07-21 19:56 Belfast_Qiu 阅读(58) 评论(0) 推荐(0)

大模型预训练

摘要： 1.分组 '1. 两种训练方法' 从零开始预训练：BV1xhYtewEum 4分30秒二次特定预训练：BV1xhYtewEum 2.创建LLM '1. 创建模型核心流程' (1)加载模型->(2)将模型放入显卡->(3)输入文本并分词-> (4)将分词放入显卡->(5)设置label->(6)模型阅读全文

posted @ 2025-07-21 17:16 Belfast_Qiu 阅读(105) 评论(0) 推荐(0)

belfastqiu

公告