2025 年 3月 9 日随笔档案 - 第七子007

2025年3月9日

摘要：现目前市面上主流大模型都是分步骤训练出来的： pre-train：让LLM具备初步的存储、记忆和理解知识的能力（目前互联网的优质token已经被耗尽，pre-train几乎走到了尽头，后续就看post-train了！） post-train：让LLM更精准、聪明，能适配某些垂直领域的特定任务！pos 阅读全文

posted @ 2025-03-09 11:40 第七子007 阅读(2062) 评论(0) 推荐(0)

第七子007

公告