随笔分类 - CUDA
摘要:CUDA共享内存使用示例如下:参考教材《GPU高性能编程CUDA实战》。P54-P65 教材下载地址:http://download.csdn.net/download/yizhaoyanbo/10150300。如果没有下载分可以评论区留下邮箱,我发你。 我的博客即将同步至腾讯云+社区,邀请大家一同
阅读全文
摘要:CUDA纹理内存的访问速度比全局内存要快,因此处理图像数据时,使用纹理内存是一个提升性能的好方法。 贴一段自己写的简单的实现两幅图像加权和的代码,使用纹理内存实现。 输入:两幅图 lena, moon 输出:两幅图像加权和
阅读全文
摘要:CUDA用于并行计算非常方便,但是GPU与CPU之间的交互,比如传递参数等相对麻烦一些。在写CUDA核函数的时候形参往往会有很多个,动辄达到10-20个,如果能够在CPU中提前把数据组织好,比如使用二维数组,这样能够省去很多参数,在核函数中可以使用二维数组那样去取数据简化代码结构。当然使用二维数据会
阅读全文
摘要:NV12格式是yuv420格式的一种,NV12格式的u,v排布顺序为交错排布,假如一幅图像尺寸为W*H,则先Y分量有W*H个,然后U分量和V分量交错排布,U分量和V分量各有W*H/4个,U,V加起来总数是Y分量的一半。 NV12内存YUV分量排布如下所示: 下面是CUDA实现的NV12格式到BGR格
阅读全文
摘要:没想到我2010年买的笔记本显卡GT330M 竟然还能跑CUDA,果断小试了一把,环境为CUDA6.5+VS2012,写了一个积分图实现均值滤波。类似于OpenCV的blur()函数。 使用lena.jpg做测试,效果如下: 代码在此: #include "cuda_runtime.h" #incl
阅读全文

浙公网安备 33010602011771号