摘要: 华为Ascend 910B部署Qwen2.5-VL-32B方案 目录一、多模态大模型——Qwen2.5-VL-32B1.1 简介1.2 显存测算1.2.1 Model Memory Calculator工具测算1.2.2 按模型参数量一般测算1.3 算力测算1.3.1 单 Token 理论计算量估算 阅读全文
posted @ 2025-06-11 10:13 阿渣熊 阅读(4809) 评论(0) 推荐(0)