随笔分类 -  cuda

摘要:CUDA中关于C++特性的限制 CUDA官方文档中对C++语言的支持和限制,懒得每次看英文文档,自己尝试翻译一下(没有放lambda表达式的相关内容,太过于复杂,我选择不用)。官方文档https://docs.nvidia.com/cuda/cuda-c-programming-guide/inde 阅读全文
posted @ 2020-06-04 22:00 bookfree 阅读(5159) 评论(0) 推荐(0)
摘要:敲代码的时候总是会去CUDA官方文档中找找思路,感觉每次看英文文档都要耗费一点时间来翻译,干脆自己翻译一下便于以后查阅。官方文档:cuda-c-language-extensions 函数修饰符 CUDA函数修饰符主要包括__global__、__device__ 和__host__ ,每个修饰符指 阅读全文
posted @ 2020-05-25 23:15 bookfree 阅读(2447) 评论(0) 推荐(1)
摘要:Cooperative Groups [TOC] Cooperative Groups(协同组) 是CUDA 9.0引入的一个新概念,主要用于跨线程块(block)的同步。为使用Cooperative Groups,我们需要包含头文件 ,同时需要 命名空间。 简介 在CUDA 9.0之前,CUDA仅 阅读全文
posted @ 2020-04-22 21:02 bookfree 阅读(5820) 评论(0) 推荐(1)
摘要:前几天做half量化时发现cublas竟然没有提供half版本的矩阵 向量乘,也就是half版本的 。自己写一个又太麻烦,重点是精度和耗时不一定比cublas提供的要好,不过cublas提供了half版本的矩阵 矩阵乘函数 ,只要维度没啥问题,用 实现 ,既方便又好用。 废话不多说,直接上。 前置准 阅读全文
posted @ 2020-04-01 00:01 bookfree 阅读(1382) 评论(0) 推荐(0)
摘要:Pascal是英伟达公司于2016年推出的新一代GPU架构,本文摘抄自英伟达Pascal架构官方白皮书 阅读全文
posted @ 2020-03-15 18:27 bookfree 阅读(2016) 评论(0) 推荐(0)
摘要:Volta架构是英伟达于2017年推出了新一代GPU架构,本文摘抄自英伟达Volta官方文档 阅读全文
posted @ 2020-03-15 18:20 bookfree 阅读(3096) 评论(0) 推荐(0)
摘要:Turing架构是英伟达2018年推出的新一代GPU架构,本文摘抄自英伟达Turing官方白皮书 阅读全文
posted @ 2020-03-15 18:05 bookfree 阅读(4704) 评论(0) 推荐(0)
摘要:CUDA(Compute Unified Device Architecture)是英伟达推出的统一运算体系,详情请参考官网https://docs.nvidia.com/cuda/,入门必读Programming Guide和Best Practices Guide,本文简要写了Programming Guide的学习笔记 阅读全文
posted @ 2020-03-15 17:36 bookfree 阅读(1646) 评论(0) 推荐(0)