博客园  :: 首页  :: 新随笔  :: 管理

2025年11月6日

摘要: Attention及Transformer工作原理概述 这篇论文是目前所有大语言模型的基石,ChatGPT、DeepSeek等等,在图像领域也有不错的应用,可以说是继NN、CNN、RNN之后新一轮AI革命的引领者。 最核心的创新点就是提出了最核心的Transformer架构和Self-Attenti 阅读全文

posted @ 2025-11-06 19:09 wsg_blog 阅读(4) 评论(0) 推荐(0)