会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
赏月斋
慎终如始 宁静致远
博客园
首页
新随笔
联系
订阅
管理
2025年1月17日
多Token预测(Multi-Token Prediction, MTP)技术
摘要: 看到DeepSeek-V3使用了多token预测(Multi-token Prediction, MTP)技术,该技术原始论文是由Meta 发在ICML 2024的一篇Poster。 论文: [2404.19737] Better & Faster Large Language Models via
阅读全文
posted @ 2025-01-17 09:35 stardsd
阅读(2519)
评论(0)
推荐(0)
公告