摘要:
前提: 1. GPU的架构为SIMD(单指令多数据流架构),即在GPU上面执行N个数据和1个数据的效率是一样的,指令相同的情况下。所以并行的计算尽量都放到GPU上。 2. GPU的设计基础为向量计算。(即向量乘法和单个float 的乘法效率一样。【CPU需要执行多次】) 性能可优化点: 1. 合并单 阅读全文
posted @ 2019-03-30 11:33
闵天
阅读(1944)
评论(0)
推荐(0)
摘要:
NameSyntaxDescription abs abs(x) Absolute value (per component). acos acos(x) Returns the arccosine of each component of x. all all(x) Test if all com 阅读全文
posted @ 2019-03-30 11:01
闵天
阅读(1001)
评论(0)
推荐(0)

浙公网安备 33010602011771号