2024 年 6月 1 日随笔档案 - Ray1997

2024年6月1日

摘要： LLM训练阶段训练大模型的三个阶段 Pre-training stage，也就是预训练阶段，其主要目的是「提高对下一个Token的预测能力」。预训练也就是从零开始创建训练大模型的意思，是基于海量文本、几万亿Token进行的，需要上万张GPU。如果你不理解什么是Token，你就把它理解成每个toke 阅读全文

posted @ 2024-06-01 13:53 Ray1997 阅读(487) 评论(0) 推荐(0)

ray1997

公告