摘要: 现目前市面上主流大模型都是分步骤训练出来的: pre-train:让LLM具备初步的存储、记忆和理解知识的能力(目前互联网的优质token已经被耗尽,pre-train几乎走到了尽头,后续就看post-train了!) post-train:让LLM更精准、聪明,能适配某些垂直领域的特定任务!pos 阅读全文
posted @ 2025-03-09 11:40 第七子007 阅读(2062) 评论(0) 推荐(0)