摘要:
以求n数之和为例,讲述规约问题。 串行规约 即直接遍历,时间复杂度为\(O(n)\)。 int sum = 0; for (int& x : v) { sum += x; } 并行规约 可以采用分治策略,例如计算[1, 2, 3, 4]的和,可以一个线程计算1+2,另一个线程计算3+4,再把结果进行 阅读全文
posted @ 2025-07-13 14:13
TimeLimit
阅读(19)
评论(0)
推荐(0)
摘要:
本篇总结一下之前提到但没有进一步展开的内存访问问题和共享内存问题。 __device__关键字与内存访问 #include <iostream> __device__ int cnt1 = 1, cnt2 = 1; // GPU上的全局变量 __global__ void kernal(int ty 阅读全文
posted @ 2025-07-13 13:18
TimeLimit
阅读(19)
评论(0)
推荐(0)

浙公网安备 33010602011771号