随笔分类 -  CUDA编程

多CPU程序开发: OpenMP-MPI(机群)和CUDA(GPU)
摘要:CPU和GPU擅长和不擅长的方面 从它们执行运算的速度与效率的方面来探讨这个论题。 CPU和GPU都是具有运算能力的芯片,CPU更像“通才”——指令运算(执行)为重+ 数值运算,GPU更像“专才”——图形类数值计算为核心。在不同类型的运算方面的速度也就决定了它们的能力——“擅长和不擅长”。芯片的速度主要取决于三个方面:微架构,主频和IPC(每个时钟周期执行的指令数)。1.微架构 从微架构上看,CP... 阅读全文

posted @ 2016-11-19 16:18 艾斯1213 阅读(2305) 评论(0) 推荐(1)

GPU 编程实例
摘要:GPU是多核技术的代表之一,在一块芯片上集成多个较低功耗的核心,单个核心频率基本不变,一般在1~3GHz,设计重心转向到多核的集成技术,GPU是一种特殊的多核处理器。本文在联想深腾7000G GPU集群上进行实验,该集群有100个节点,每个节点包含两个4核CPU(Intel XEON),16GB内存,其中16个节点配置一块GPU卡,18个节点配置两块GPU卡。 编译GPU程序:nvcc –o ve... 阅读全文

posted @ 2016-11-18 11:28 艾斯1213 阅读(784) 评论(0) 推荐(0)

导航