04 2020 档案

摘要:Cooperative Groups [TOC] Cooperative Groups(协同组) 是CUDA 9.0引入的一个新概念,主要用于跨线程块(block)的同步。为使用Cooperative Groups,我们需要包含头文件 ,同时需要 命名空间。 简介 在CUDA 9.0之前,CUDA仅 阅读全文
posted @ 2020-04-22 21:02 bookfree 阅读(5820) 评论(0) 推荐(1)
摘要:前几天做half量化时发现cublas竟然没有提供half版本的矩阵 向量乘,也就是half版本的 。自己写一个又太麻烦,重点是精度和耗时不一定比cublas提供的要好,不过cublas提供了half版本的矩阵 矩阵乘函数 ,只要维度没啥问题,用 实现 ,既方便又好用。 废话不多说,直接上。 前置准 阅读全文
posted @ 2020-04-01 00:01 bookfree 阅读(1382) 评论(0) 推荐(0)