随笔分类 - cuda
摘要:CUDA中关于C++特性的限制 CUDA官方文档中对C++语言的支持和限制,懒得每次看英文文档,自己尝试翻译一下(没有放lambda表达式的相关内容,太过于复杂,我选择不用)。官方文档https://docs.nvidia.com/cuda/cuda-c-programming-guide/inde
阅读全文
摘要:敲代码的时候总是会去CUDA官方文档中找找思路,感觉每次看英文文档都要耗费一点时间来翻译,干脆自己翻译一下便于以后查阅。官方文档:cuda-c-language-extensions 函数修饰符 CUDA函数修饰符主要包括__global__、__device__ 和__host__ ,每个修饰符指
阅读全文
摘要:Cooperative Groups [TOC] Cooperative Groups(协同组) 是CUDA 9.0引入的一个新概念,主要用于跨线程块(block)的同步。为使用Cooperative Groups,我们需要包含头文件 ,同时需要 命名空间。 简介 在CUDA 9.0之前,CUDA仅
阅读全文
摘要:前几天做half量化时发现cublas竟然没有提供half版本的矩阵 向量乘,也就是half版本的 。自己写一个又太麻烦,重点是精度和耗时不一定比cublas提供的要好,不过cublas提供了half版本的矩阵 矩阵乘函数 ,只要维度没啥问题,用 实现 ,既方便又好用。 废话不多说,直接上。 前置准
阅读全文
摘要:Pascal是英伟达公司于2016年推出的新一代GPU架构,本文摘抄自英伟达Pascal架构官方白皮书
阅读全文
摘要:Volta架构是英伟达于2017年推出了新一代GPU架构,本文摘抄自英伟达Volta官方文档
阅读全文
摘要:Turing架构是英伟达2018年推出的新一代GPU架构,本文摘抄自英伟达Turing官方白皮书
阅读全文
摘要:CUDA(Compute Unified Device Architecture)是英伟达推出的统一运算体系,详情请参考官网https://docs.nvidia.com/cuda/,入门必读Programming Guide和Best Practices Guide,本文简要写了Programming Guide的学习笔记
阅读全文
浙公网安备 33010602011771号