会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
jiangliqiu
博客园
首页
新随笔
联系
订阅
管理
2025年2月16日
大规模语言模型Transformer架构
摘要: 1.1 大规模语言模型的发展可以粗略的分为如下三个阶段:基础模型、能力探索、突破发展。 基础模型阶段主要集中于 2018 年至 2021 年,2017 年 Vaswani 等人提出了 Transformer架构,在机器翻译任务上取得了突破性进展。2018 年 Google 和 Open AI 分别提
阅读全文
posted @ 2025-02-16 15:02 江蓠秋
阅读(254)
评论(0)
推荐(0)
公告