08 2024 档案

摘要:【LLM训练系列】NanoGPT源码详解和中文GPT训练实践本文是【训练LLM系列】的第一篇,主要重点介绍NanoGPT代码以及中文、英文预训练实践。最新版参见我的知乎:https://zhuanlan.zhihu.com/p/716442447 除跑通原始NanoGPT代码之外,分别使用了《红楼梦》、四大名著和几十本热门网络小说,进行了字符级、自行训练to 阅读全文
posted @ 2024-08-25 23:28 LeonYi 阅读(1724) 评论(0) 推荐(0)