摘要: 知道了CUDA编程基础,我们就来个简单的实战:利用CUDA编程实现两个向量的加法。在实现之前,先简单介绍一下CUDA编程中内存管理API。首先是在device上分配内存的cudaMalloc函数。 cudaError_t cudaMalloc(void** devPtr, size_t size); 阅读全文
posted @ 2021-07-05 10:24 手磨咖啡 阅读(1186) 评论(0) 推荐(0)
摘要: 摘要 本文主要讲述CUDA的threadIdx。 1. Grid,Block和Thread三者的关系 其中,一个grid包含多个blocks,这些blocks的组织方式可以是一维,二维或者三维。任何一个block包含有多个Threads,这些Threads的组织方式也可以是一维,二维或者三维。举例来 阅读全文
posted @ 2021-07-05 09:21 手磨咖啡 阅读(1168) 评论(0) 推荐(0)