随笔分类 - CUDA
Compute Unified Device Architecture
摘要:Amdahl's Law 程序可能的加速比取决于可以被并行化的部分。如果没有可以被并行化的部分,则P=0,speedup=1,no speedup。如果全部可以被并行化,P=1,speedup is infinite(in thecory)。可以获得无穷大的加速比。如果50%可以被并行化,max...
阅读全文
摘要:个人认为CPU和GPU各有自己的适应领域。CPU(Central Processing Unit)计算核心较少,通常是双核、四核、八核,但是拥有大量的共享缓存、预测、乱序执行等优化,可以做逻辑非常复杂的计算任务。这一点就当前的GPU来说,仍然难以做到。会牺牲大量的性能、造成大量的能耗开销,而且增...
阅读全文
摘要:0.引言 本文记载了CUDA的学习过程~刚开始接触GPU相关的东西,包括图形、计算、并行处理模式等,先从概念性的东西入手,然后结合实践开始学习。CUDA感觉没有一种权威性的书籍,开发工具变动也比较快,所以总感觉心里不是很踏实。所以本文就是从初学者的角度,从无知开始探索的过程。当然在学习过程中避免不了...
阅读全文
摘要:问题一:>LINK : fatal error LNK1123:转换到COFF期间失败:文件无效或损坏将项目——项目属性——配置属性——连接器——清单文件——嵌入清单“是”改为“否”问题二:vs2010正在为.dll加载符号-工具---选项----调试----符号,看右边有个“Microsoft符号...
阅读全文

浙公网安备 33010602011771号