摘要: 本文是 Stanford CS336 课程学习记录的一部分。 撰写本文时,模型尚未经过训练,尽管模块可以通过测试,但可能仍然存在一些潜在问题。本文仅供参考。 概述 在 CS336 课程的作业 1 中,要求我们基于 PyTorch 框架自己实现一个 Transformer 语言模型并训练它。本文记录模 阅读全文
posted @ 2025-08-03 18:00 Eslzzyl 阅读(175) 评论(0) 推荐(0)