GPU上稀疏矩阵的基本线性代数

GPU上稀疏矩阵的基本线性代数

cuSPARSE库为稀疏矩阵提供了GPU加速的基本线性代数子例程,这些子例程的执行速度明显快于仅CPU替代方法。提供了可用于构建GPU加速求解器的功能。cuSPARSE被从事机器学习,计算流体力学,地震勘探和计算科学等应用的工程师和科学家广泛使用。使用cuSPARSE,应用程序会自动受益于常规性能的改进和新的GPU架构。cuSPARSE库包含在NVIDIA HPC SDKCUDA Toolkit中

cuSPARSE性能

cuSPARSE库针对NVIDIA GPU的性能进行了高度优化,其SpMM性能比仅CPU的替代产品快30-150倍。

cuSPARSE的主要功能

  • 支持密集,COO,CSR,CSC和Blocked CSR稀疏矩阵格式
  • 全套稀疏例程,包括稀疏向量x稠密向量运算,稀疏矩阵x稠密向量运算以及稀疏矩阵x稠密矩阵运算。
  • 稀疏矩阵x稀疏矩阵加法和乘法的例程
  • 稀疏密集向量乘法(SpVV),稀疏矩阵密集向量乘法(SpMV)和稀疏矩阵密集矩阵乘法(SpMM)的通用高性能API
  • ILU0和IC0预调节器

 

 

 

 

posted @ 2021-02-20 07:40  吴建明wujianming  阅读(748)  评论(0)    收藏  举报