摘要: 1.AMD opencl-optimization-guidehttp://developer.amd.com/tools-and-sdks/opencl-zone/amd-accelerated-parallel-processing-app-sdk/opencl-optimization-gui... 阅读全文
posted @ 2015-12-11 16:44 mlj318 阅读(374) 评论(0) 推荐(0) 编辑
摘要: 1.根据前两次的最终结果:使用普通buffer,Horizontal 5ms, Vertical 17 ms使用image buffer:Horizontal 9.4ms, Vertical 6.4 ms那么使用 Horizontal普通buffer,Vertical image buffer 组合... 阅读全文
posted @ 2015-12-11 16:17 mlj318 阅读(1376) 评论(0) 推荐(0) 编辑
摘要: 1.buffer使用image的方式:Horizontal 与 Vertical 算法一样, 共需30ms,wait time 19ms.const sampler_t sampler = CLK_NORMALIZED_COORDS_FALSE | CLK_ADDRESS_CLAMP_TO_EDGE... 阅读全文
posted @ 2015-12-11 16:11 mlj318 阅读(676) 评论(0) 推荐(0) 编辑
摘要: Platform: LG G3, Adreno 330 ,img size 3264x2448 C code neon GPU 300 60 29 单位:ms 1.目前按如下行列分解的方式最快29ms,HorizontalkernelglobalWorksize[1] ... 阅读全文
posted @ 2015-12-11 16:01 mlj318 阅读(1474) 评论(1) 推荐(0) 编辑
摘要: Platform:LG G3,Adreno 3301.8M(3264x2448)memmap方式读入时间24ms,读出时间12ms,时间与内存大小基本成线性关系。使用memmap与 memcopy(clEnqueueWriteBuffer)方式并无时间差异。2.使用pingpong的方式,使memo... 阅读全文
posted @ 2015-12-11 15:53 mlj318 阅读(411) 评论(0) 推荐(0) 编辑
摘要: sobel检测的C版本,neon和GPU的时间比较。 Platform: LG G3, Adreno 330 ,img size 3264x2448 sobel: C code neon GPU 73 13 42+3.7+6.6 单位:ms GPU时间=memory time+Queued time 阅读全文
posted @ 2015-12-11 15:47 mlj318 阅读(1054) 评论(0) 推荐(0) 编辑