随笔分类 -  【14】CUDA并行计算_应用实践

摘要:本文讨论如何使用 CUDA 对代码进行并行优化,并给出不同并行思路对均值滤波的实现。 阅读全文
posted @ 2017-01-19 15:52 穆晨 阅读(1881) 评论(0) 推荐(0)
摘要:本文的目的很明确:介绍如何将二维数组传递进显存,以及如何将二维数组从显存传递回主机端。 阅读全文
posted @ 2017-01-19 15:47 穆晨 阅读(1686) 评论(0) 推荐(0)
摘要:在并发,多线程环境下,同步是一个很重要的环节。同步即是指进程/线程之间的执行顺序约定。 本文将介绍如何通过共享内存机制实现块内多线程之间的同步。 阅读全文
posted @ 2017-01-19 15:25 穆晨 阅读(7462) 评论(0) 推荐(0)
摘要:编写 CUDA 程序真心不是个简单的事儿,调试也不方便,很费时。那么有没有一些现成的 CUDA 库来调用呢? 答案是有的,如 CUBLAS 就是 CUDA 专门用来解决线性代数运算的库。 本文将大致介绍如何使用 CUBLAS 库,同时演示一个使用 CUBLAS 库进行矩阵乘法的例子。 阅读全文
posted @ 2017-01-19 15:20 穆晨 阅读(3222) 评论(0) 推荐(1)
摘要:本文将介绍 CUDA 编程的基本模式,所有 CUDA 程序都基于此模式编写,即使是调用库,库的底层也是这个模式实现的。 阅读全文
posted @ 2017-01-19 15:16 穆晨 阅读(2988) 评论(0) 推荐(0)
摘要:并行就是让计算中相同或不同阶段的各个处理同时进行。 目前有很多种实现并行的手段,如多核处理器,分布式系统等,而本专题的文章将主要介绍使用 GPU 实现并行的方法。 阅读全文
posted @ 2017-01-19 14:59 穆晨 阅读(2990) 评论(0) 推荐(0)
摘要:本文讲解如何在VS 2010开发平台中搭建CUDA开发环境。 阅读全文
posted @ 2017-01-19 14:41 穆晨 阅读(3018) 评论(2) 推荐(0)