会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Tokepsonの万事屋
博客园
首页
新随笔
联系
订阅
管理
2025年5月12日
Transformer架构介绍+从零搭建预训练模型项目
摘要: Transformer架构详解 1. 架构概述 Transformer是一种基于自注意力机制的神经网络架构,由Vaswani等人在2017年的论文《Attention Is All You Need》中首次提出。它彻底改变了自然语言处理领域,逐步取代了传统的RNN和CNN架构。 主要特点 完全基于注
阅读全文
posted @ 2025-05-12 13:32 tokepson
阅读(502)
评论(0)
推荐(0)
公告