zyl910

优化技巧、硬件体系、图像处理、图形学、游戏编程、国际化与文本信息处理。

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

2025年8月31日

摘要: GEMM(General Matrix Multiply,通用矩阵乘法)是科学计算与深度学习等领域的核心算法。 以前用 C# 开发的GEMM程序的性能,比MKL、OpenBLAS差得远,这是因为那时的 .NET 不支持SIMD硬件加速技术。从2014年开始, .NET 对SIMD硬件加速技术的支持越来越完善了。我潜心研究用该技术来改进 C# GEMM程序的性能,最近有了重大突破——对于1024尺寸矩阵的SGEMM,我的算法比基础算法的性能提升1080倍,与 MKL、OpenBLAS的测试结果在同一梯队。 阅读全文
posted @ 2025-08-31 17:35 zyl910 阅读(219) 评论(3) 推荐(5)