08 2017 档案

摘要:如果我们需要优化kernel程序,我们必须知道一些GPU的底层知识,本文简单介绍一下GPU内存相关和线程调度知识,并且用一个小示例演示如何简单根据内存结构优化。 一、GPU总线寻址和合并内存访问 假设X指向一个32位整数数组的指针,数组首地址是0x00001232,那么一个线程需要访问第0个成员时是也许是如下访问的: int tmp = X[0] 假设内存总线宽度是256位,内存访问时必须和... 阅读全文
posted @ 2017-08-20 20:17 reyzal 阅读(10476) 评论(0) 推荐(0) 编辑
摘要:本文编写一个计算两个数组和的程序,用CPU和GPU分别运算,计算运算时间,并且校验最后的运算结果。文中代码偏多,原理建议阅读下面文章,文中介绍了OpenCL相关名词概念。 http://opencl.codeplex.com/wikipage?title=OpenCL%20Tutorials%20-%201 (英文版) http://www.cnblogs.com/leiben/archive... 阅读全文
posted @ 2017-08-18 22:45 reyzal 阅读(3191) 评论(0) 推荐(0) 编辑
摘要:组装的电脑没带独立显卡,用的是CPU自带的核显,型号是Intel HD Graphics 530,关于显卡是否可以使用OpenCL,可以下载GPU-Z软件查看。 本文在Windows 10 64位系统上搭建OpenCL开发环境。 一、准备文件 将显卡驱动更新到最新版本,Windows 驱动中自动包含 阅读全文
posted @ 2017-08-18 15:39 reyzal 阅读(16837) 评论(0) 推荐(2) 编辑