会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
anluo8
博客园
首页
新随笔
联系
订阅
管理
2025年4月30日
高性能计算-SGEMM矩阵乘法(29)
摘要: 1. 介绍 矩阵A(MK) B(KN)单精度浮点数进行矩阵乘法; 分别实现CPU串行,GPU多种并行计算算法,与 cublas 库 sgemm 函数效率对比。 2. gpu 并行算法简介 并行算法一:二维block,一个线程程计算一个C元素,缺点:访存次数过多 并行算法二: 优化一: 使用线程块 t
阅读全文
posted @ 2025-04-30 17:00 安洛8
阅读(128)
评论(0)
推荐(0)
公告