随笔分类 -  已迁移至(博客园_穆晨)

更加深入地学习 CUDA 并行计算技术
六 GPU 并行优化的几种典型策略
摘要:前言 如何对现有的程序进行并行优化,是 GPU 并行编程技术最为关注的实际问题。本文将提供几种优化的思路,为程序并行优化指明道路方向。优化前准备 首先,要明确优化的目标 - 是要将程序提速 2 倍?还是 10 倍?100倍?也许你会不假思索的说当然是提升越高越好。 但这里存在一个优化成本的问题... 阅读全文

posted @ 2014-08-17 15:55 空山悟 阅读(748) 评论(0) 推荐(0)

五 浅谈CPU 并行编程和 GPU 并行编程的区别
摘要:前言 CPU 的并行编程技术,也是高性能计算中的热点,也是今后要努力学习的方向。那么它和 GPU 并行编程有何区别呢? 本文将做出详细的对比,分析各自的特点,为将来深入学习 CPU 并行编程技术打下铺垫。区别一:缓存管理方式的不同 GPU:缓存对程序员不透明,程序员可根据实际情况操纵大部分缓存... 阅读全文

posted @ 2014-08-11 21:39 空山悟 阅读(760) 评论(0) 推荐(0)

四 GPU 并行编程的存储系统架构
摘要:前言 在用 CUDA 对 GPU 进行并行编程的过程中,除了需要对线程架构要有深刻的认识外,也需要对存储系统架构有深入的了解。 这两个部分是 GPU 编程中最为基础,也是最为重要的部分,需要花时间去理解吸收,加深内功。 了解 GPU 存储系统架构的意义 CUDA 编程架构的设计思路本身也就是让... 阅读全文

posted @ 2014-08-11 21:07 空山悟 阅读(957) 评论(0) 推荐(0)

三 GPU 并行编程的运算架构
摘要:前言 GPU 是如何实现并行的?它实现的方式较之 CPU 的多线程又有什么分别?本文将做一个较为细致的分析。GPU 并行计算架构 GPU 并行编程的核心在于线程,一个线程就是程序中的一个单一指令流,一个个线程组合在一起就构成了并行计算网格,成为了并行的程序,下图展示了多核 CPU 与 GPU 的... 阅读全文

posted @ 2014-08-03 10:36 空山悟 阅读(730) 评论(0) 推荐(0)

导航