会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
风间悠香
风间悠香的笔记本
博客园
新随笔
管理
随笔分类 -
[并行计算]
并行计算基础(3)
摘要:一、重新分析矩阵相乘 上述代码实现了矩阵相乘,但是只使用了一个Block来完成,那么能够计算的矩阵大小就被Block的最大容量所限制了。我们要完成大型矩阵相乘的计算,则需要将矩阵分块来处理,也就是使用多个Block来并行完成: 在调用时,我们需要计算需要多少个Blocks,由于例子中使用的是方阵,所
阅读全文
posted @
2019-09-02 17:23
风间悠香
阅读(588)
评论(0)
推荐(0)
并行计算基础(2)
摘要:一、CPU和GPU交互 1.各自有自己的物理内存空间,CPU的是内存,GPU的是显存 2.通过PCI-E总线互连(8GB/S~16GB/S) 3.交互开销较大 GPU各存储访存速度: Register寄存器,最快 Shared Memory,共享存储,很快 Local Memory,本地存储,在显存
阅读全文
posted @
2019-08-29 17:41
风间悠香
阅读(1084)
评论(0)
推荐(0)
并行计算基础(1)(GPU架构介绍)
摘要:一、常用术语 Task:任务。可以完整得到结果的一个程序,一个程序段或若干个程序段。例如搬砖。 Parallel Task:并行任务。可以并行计算的任务。多个人搬砖。 Serial Execution:串行执行。一个人搬砖。 Parallel Execution:并行执行。多个人一起搬砖。 Shar
阅读全文
posted @
2019-08-29 10:51
风间悠香
阅读(2426)
评论(0)
推荐(2)