随笔分类 - 并行编程与GPU 架构
摘要:Framework - A software platform which supports machine learning algorithms. To explore various frameworks, click here. Tensorflow - An open-source num
阅读全文
摘要:In this article, we will cover just-in-time and ahead-of-time compilation. We will look at it in the context of an Angular project, but the principles
阅读全文
摘要:* 参考spec:the-compute-architecture-of-intel-processor-graphics-gen9-v1d0.pdf SOC 架构 Gen9 架构是早期用在igpu 中的,igpu 集成在在整个cpu 的base die上。 Gen 9 是一个非常经典的架构,其中的
阅读全文
摘要:GTX480-Compute 2.0 capability 有 15 个 core 或者说 SM( Streaming Multiprocessors ) 每个 SM, 一般有 32 cuda 处理器 共 480 个 cuda 处理器 带 ECC 的 global memory 每个 SM 内的线程
阅读全文
摘要:AMD 5870 显卡 (cypress) 架构 20 个 simd 引擎,每个 simd 引擎包含 16 个 simd 每个 simd 包含 16 个 stream core 每个 stream core 都是 5 路的乘法 -加法运算单元( VLIW processing) 每个 stream
阅读全文
摘要:本篇是GPGPU 架构汇总的总章,参考的是AMD公布OpenCL 手册,该手册总结了AMD. Nvdia 早年的GPGPU体系架构,以及Opencl 各个API 与硬件结构的映射关系。本篇除了整理这两家的GPU 架构,也会增加Intel dGPU的架构(牙膏厂终于回过神了。。。。) 对于现代的 GP
阅读全文
摘要:1、什么是Embarrassingly Parallel(易并行计算问题) 易并行计算问题:A computation that can be divided into a number of completely independent tasks。在编写并行程序过程中,首先需要将一个问题分解成若
阅读全文
摘要:这篇帖子是对常用的平行计算问题方法的汇总,俗话说API好学,但是算法难用。除了需要了解常用的并行计算API(MPI、Pthread、openMP),更重要是要学会如何将串行问题(serial programming)进行合理的拆分,从而编写出能够并行计算的程序。 程序顺序执行、串行编写比较符合咱们的
阅读全文
摘要:MPI 即 Message-Passing Interface,提供了一系列并行编程的接口,为了在本机能够学习和使用并行编程,需要提前安装MPI; 配置环境: Microsoft Visual Studio Community 2019 MPI 安装MPI: 1、首先下载MPI,这里需要下载两个文件
阅读全文

浙公网安备 33010602011771号