摘要: 本文记录一下模仿nanoGPT项目,使用自顶向下的编程法一步步手写GPT的过程。阅读本文需要了解Transformer,GPT,和PyTorch的基础知识。 下面是会用到的所有python库 import math # will use math.sqrt from dataclasses impo 阅读全文
posted @ 2024-08-02 02:06 zrq96 阅读(236) 评论(0) 推荐(0)