摘要: 最近接触了 GPU 编程,尝试了用 CUDA 写一些并行计算案例,拿了矩阵乘法作为第一个练手项目。 过去的经验让我误以为这东西很 naive,但其实从并行的角度看,会发现很多串行思维所没有机会接触的细节——总体而言,虽然遇到不少困难,但还是觉得收获丰富。 矩阵乘法的实现优化有非常多的方法,这里只是简 阅读全文
posted @ 2025-10-24 22:37 Lice_wx 阅读(22) 评论(0) 推荐(0)