2012 年 7月 7 日随笔档案 - 喜欢阿亮的小水

2012年7月7日

摘要：目前市场上的NVIDIA显卡都是基于Tesla架构的，分为G80、G92、GT200三个系列。Tesla体系架构是一块具有可扩展处器数量的处理器阵列。每个GT200 GPU包含240个流处理器（streaming processor,SP），每8个流处理器又组成了一个流多处理器(streaming multiprocessor,SM)，因此共有30个流多处理器。GPU在工作时，工作负载由PCI-E总线从CPU传入GPU显存，按照体系架构的层次自顶向下分发。PCI-E 2.0规范中，每个通道上下行的数据传输速度达到了5.0Gbit/s，这样PCI-E2.0×16插槽能够为上下行数据各提阅读全文

posted @ 2012-07-07 20:18 喜欢阿亮的小水阅读(900) 评论(0) 推荐(0)

CUDA存储器模型（转）

摘要： CUDA存储器模型：GPU片内：register，shared memory；板载显存：local memory,constant memory, texture memory, texture memory,global memory;host 内存： host memory, pinned memory.register: 访问延迟极低；基本单元：register file （32bit/each）计算能力1.0/1.1版本硬件：8192/SM；计算能力1.2/1.3版本硬件： 16384/SM; 每个线程占有的register有限，编程时不要为其分配过多私有变量；local me. 阅读全文

posted @ 2012-07-07 18:41 喜欢阿亮的小水阅读(826) 评论(0) 推荐(1)

大家一起来学习cuda C (zhuan)

摘要： CUDA C不是C语言，而是对C语言进行扩展。CUDA对C的扩展主要包括以下四个方面：函数类型限定符，用来确定函数是在CPU还是在GPU上执行，以及这个函数是从CPU调用还是从GPU调用。__device__，__device__表示从GPU上调用，在GPU上执行； __global__，__global__表示在CPU上调用，在GPU上执行，也就是所谓的内核(kernel)函数；内核主要用来执行多线程调用。 __host__，__host__表明在CPU上调用，在CPU上执行，这是默认时的情况，也就是传统的C函数。CUDA支持__host__和__device__的联用，表示同时为主机和设阅读全文

posted @ 2012-07-07 16:11 喜欢阿亮的小水阅读(638) 评论(0) 推荐(0)

喜欢阿亮的小水

公告