文章分类 -  CUDA

cuda性能优化
摘要:本文系转载:http://blog.csdn.net/lesky/article/details/5913352 CUDA 优化的最终目的是:在最短的时间内,在允许的误差范围内完成给定的计算任务。在这里,“最短的时间”是指整个程序运行的时间,更侧重于计算的吞吐量,而不是单个数据的延迟。在开始考虑使用 阅读全文

posted @ 2016-08-14 23:12 d神 阅读(2244) 评论(0) 推荐(0)

CUDA:低占用率下的更好性能(三)
摘要:转自http://blog.sina.com.cn/s/blog_70684c2a0100vjjb.html 转自http://blog.sina.com.cn/s/blog_70684c2a0100vjjb.html 前两部分是有关ILP隐藏计算和访存延迟,从而在GPU低占用率的情况下达到高并行度 阅读全文

posted @ 2016-08-14 14:01 d神 阅读(347) 评论(0) 推荐(0)

低占用率下的更好性能(二)
摘要:转自新浪博客http://blog.sina.com.cn/s/blog_70684c2a0100vjhj.html,不过原文应该在nv的论坛上的。 上一部分是用IPL隐藏指令延迟,这一部分是用ILP隐藏显存访问延迟。 2.使用更少线程隐藏内存访问延迟 隐藏内存访问延迟,使用相同的说明方式,但针对内 阅读全文

posted @ 2016-08-14 13:58 d神 阅读(171) 评论(0) 推荐(0)

CUDA:低占用率下的更好性能(一)
摘要:转自新浪博客http://blog.sina.com.cn/s/blog_70684c2a0100vjhj.html,不过原文应该在nv的论坛上的。 转自新浪博客http://blog.sina.com.cn/s/blog_70684c2a0100vjhj.html,不过原文应该在nv的论坛上的。 阅读全文

posted @ 2016-08-14 13:54 d神 阅读(1068) 评论(0) 推荐(0)

cuda程序优化的15个策略
摘要:本文系转载,介绍了常识性的cuda优化策略,虽然有些已经过时,但思想不会过时。 原文链接:https://cudazone.nvidia.cn/tech-sharing/%E6%8E%A8%E8%8D%90cuda%E7%A8%8B%E5%BA%8F%E4%BC%98%E5%8C%96%E7%9A% 阅读全文

posted @ 2016-08-12 14:56 d神 阅读(10505) 评论(0) 推荐(0)

导航