摘要:
▶ CUDA 动态并行实现快排算法(单线程的递归调用) ▶ 源代码:动态并行递归调用线程块。要点:添加 -rdc=true 选项(生成 relocatable device code,相当于执行分离编译),以及链接库 cudadevrt.lib (用于动态并行,不同于运行时库 cudart.lib) 阅读全文
posted @ 2017-10-24 23:23
爨爨爨好
阅读(572)
评论(0)
推荐(0)
|
摘要:
▶ CUDA 动态并行实现快排算法(单线程的递归调用) ▶ 源代码:动态并行递归调用线程块。要点:添加 -rdc=true 选项(生成 relocatable device code,相当于执行分离编译),以及链接库 cudadevrt.lib (用于动态并行,不同于运行时库 cudart.lib) 阅读全文
posted @ 2017-10-24 23:23
爨爨爨好
阅读(572)
评论(0)
推荐(0)
摘要:
▶ CPU - GPU 异步操作 ▶ 源代码 ● 输出结果: ▶ 新姿势: ● 调用主函数时的第0个参数作为程序名字符串,可以用于输出。 ● 在没有附加 flag 的情况下申请主机内存,注意使用cudaFreeHost释放 ● 记录 CPU 调用 CUDA 所用的时间 ● 查看GPU队列状态的函数 阅读全文
posted @ 2017-10-24 14:56
爨爨爨好
阅读(283)
评论(0)
推荐(0)
|