Transformer Bert 基础讲解

参考链接:

史上最小白之Transformer详解_Tink1995的博客-CSDN博客_transformer

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史 - 知乎

史上最小白之Bert详解_Tink1995的博客-CSDN博客

BERT之后的模型有哪些? - 知乎

从 Transformer 说起 - 知乎

谷歌Transformer再升级——新模型实现性能、速度双提升,发展潜力巨大_数据猿-CSDN博客

GPT-2通俗详解 - BrianX - 博客园

Attention机制介绍(原理+代码)_sun_xiao_kai的博客-CSDN博客_attention机制代码

绝对干货!NLP预训练模型:从transformer到albert_木东的博客-CSDN博客

【NLP】Transformer模型原理详解 - 知乎

两年来预训练模型的技术进展(2018-2020)_Mr_不想起床的博客-CSDN博客

 

整理了上面的内容

 

 

 

posted on 2020-12-12 11:28  若流芳千古  阅读(208)  评论(0编辑  收藏  举报

导航