2025 年 9月 17 日随笔档案 - KakaDBL

2025年9月17日

[1hr Talk] Intro to Large Language Models - Andrej Karpathy

摘要： LLM Inference 大语言模型的推理部分较为简单，本质上只需要两个文件即可，一个txt来存储神经网络中的所有参数，另一个代码文件来获取参数从而进行计算，这部分相比训练部分来说消耗资源较少。 LLM Training 大语言模型的训练主要包括两部分：预训练阶段 (Pre-training)：阅读全文

posted @ 2025-09-17 16:40 KakaDBL 阅读(13) 评论(0) 推荐(0)

Loading

NEVER STOP THINKING

菜菜的小做题家

公告