GPGPU OpenCL Reduction操作与group同步
摘要:
Reduction操作:规约操作就是由多个数生成一个数,如求最大值、最小值、向量点积、求和等操作,都属于这一类操作。有大量数据的情况下,使用GPU进行任务并行与数据并行,可以收到可好的效果。group同步:OpenCL只提供了工作组内的各线程之间的同步机制,并没有提供所有线程的同步。提供组内item-work同步的方法: void barrier (cl_mem_fence_flags flags) 参数说明:cl_mem_fence_flags 可以取CLK_LOCAL_MEM_FENCE、CLK_GLOBAL_MEM_FENCE 函数说明:(1)一个work-group中所有work... 阅读全文
posted @ 2014-03-17 17:14 旭东的博客 阅读(5586) 评论(1) 推荐(0)
浙公网安备 33010602011771号