摘要:
假设我们有一个来自 HuggingFace 的Transformer模型。 我们如何确定 它的参数数量? 它的内存需求? 它的网络结构? 我们以GPT2作为例子进行介绍 from transformers import GPT2Model model = GPT2Model.from_pretrai 阅读全文
posted @ 2025-03-10 13:58
PowerZZJ
阅读(44)
评论(0)
推荐(0)
摘要:
扩散模型推导前置 鉴于扩散模型是一个非常严谨的数学推导过程,所以开始讲解DDPM等众多扩散模型公式前,需要先了解推导所需要的基本知识。其中涉及到的高等数学的内容都算比较简单的。本文将对论文的background段落的关键公式进行推导,尽量以高等数学基础知识解释清楚这里的背景原理,让看论文的人没那么懵 阅读全文
posted @ 2025-03-10 13:58
PowerZZJ
阅读(107)
评论(0)
推荐(0)