会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
cywuuuu
博客园
首页
新随笔
联系
订阅
管理
2025年10月19日
华为昇腾笔记之Mindspeed-LLM 中 MoE 实现机制与重写逻辑总览
摘要: 🧩 Mindspeed-LLM 的 MoE 实现机制与重写逻辑总览 Mindspeed-LLM 基于 Megatron-Core 的 MoE 框架,在运行前通过一系列 Monkey Patch / Wrapper 注册, 将 Megatron 的核心 MoE 模块(Experts 层、Router
阅读全文
posted @ 2025-10-19 12:47 cywuuuu
阅读(43)
评论(0)
推荐(0)
公告