Loading

随笔分类 -  并行编程与GPU 架构

摘要:Framework - A software platform which supports machine learning algorithms. To explore various frameworks, click here. Tensorflow - An open-source num 阅读全文
posted @ 2023-03-02 00:56 aalanwyr 阅读(39) 评论(0) 推荐(0)
摘要:In this article, we will cover just-in-time and ahead-of-time compilation. We will look at it in the context of an Angular project, but the principles 阅读全文
posted @ 2023-01-09 23:24 aalanwyr 阅读(125) 评论(0) 推荐(0)
摘要:* 参考spec:the-compute-architecture-of-intel-processor-graphics-gen9-v1d0.pdf SOC 架构 Gen9 架构是早期用在igpu 中的,igpu 集成在在整个cpu 的base die上。 Gen 9 是一个非常经典的架构,其中的 阅读全文
posted @ 2022-11-06 21:51 aalanwyr 阅读(1503) 评论(0) 推荐(0)
摘要:GTX480-Compute 2.0 capability 有 15 个 core 或者说 SM( Streaming Multiprocessors ) 每个 SM, 一般有 32 cuda 处理器 共 480 个 cuda 处理器 带 ECC 的 global memory 每个 SM 内的线程 阅读全文
posted @ 2022-11-02 22:31 aalanwyr 阅读(363) 评论(0) 推荐(0)
摘要:AMD 5870 显卡 (cypress) 架构 20 个 simd 引擎,每个 simd 引擎包含 16 个 simd 每个 simd 包含 16 个 stream core 每个 stream core 都是 5 路的乘法 -加法运算单元( VLIW processing) 每个 stream 阅读全文
posted @ 2022-11-02 22:12 aalanwyr 阅读(1404) 评论(0) 推荐(0)
摘要:本篇是GPGPU 架构汇总的总章,参考的是AMD公布OpenCL 手册,该手册总结了AMD. Nvdia 早年的GPGPU体系架构,以及Opencl 各个API 与硬件结构的映射关系。本篇除了整理这两家的GPU 架构,也会增加Intel dGPU的架构(牙膏厂终于回过神了。。。。) 对于现代的 GP 阅读全文
posted @ 2022-11-02 22:01 aalanwyr 阅读(1208) 评论(0) 推荐(0)
摘要:1、什么是Embarrassingly Parallel(易并行计算问题) 易并行计算问题:A computation that can be divided into a number of completely independent tasks。在编写并行程序过程中,首先需要将一个问题分解成若 阅读全文
posted @ 2021-12-09 16:26 aalanwyr 阅读(2591) 评论(1) 推荐(1)
摘要:这篇帖子是对常用的平行计算问题方法的汇总,俗话说API好学,但是算法难用。除了需要了解常用的并行计算API(MPI、Pthread、openMP),更重要是要学会如何将串行问题(serial programming)进行合理的拆分,从而编写出能够并行计算的程序。 程序顺序执行、串行编写比较符合咱们的 阅读全文
posted @ 2021-12-09 13:11 aalanwyr 阅读(635) 评论(0) 推荐(0)
摘要:MPI 即 Message-Passing Interface,提供了一系列并行编程的接口,为了在本机能够学习和使用并行编程,需要提前安装MPI; 配置环境: Microsoft Visual Studio Community 2019 MPI 安装MPI: 1、首先下载MPI,这里需要下载两个文件 阅读全文
posted @ 2021-12-03 16:02 aalanwyr 阅读(2613) 评论(1) 推荐(0)