摘要:
GEMM(General Matrix Multiply,通用矩阵乘法)是科学计算与深度学习等领域的核心算法。
以前用 C# 开发的GEMM程序的性能,比MKL、OpenBLAS差得远,这是因为那时的 .NET 不支持SIMD硬件加速技术。从2014年开始, .NET 对SIMD硬件加速技术的支持越来越完善了。我潜心研究用该技术来改进 C# GEMM程序的性能,最近有了重大突破——对于1024尺寸矩阵的SGEMM,我的算法比基础算法的性能提升1080倍,与 MKL、OpenBLAS的测试结果在同一梯队。 阅读全文
posted @ 2025-08-31 17:35
zyl910
阅读(219)
评论(3)
推荐(5)

浙公网安备 33010602011771号