摘要: 前提: 1. GPU的架构为SIMD(单指令多数据流架构),即在GPU上面执行N个数据和1个数据的效率是一样的,指令相同的情况下。所以并行的计算尽量都放到GPU上。 2. GPU的设计基础为向量计算。(即向量乘法和单个float 的乘法效率一样。【CPU需要执行多次】) 性能可优化点: 1. 合并单 阅读全文
posted @ 2019-03-30 11:33 闵天 阅读(1731) 评论(0) 推荐(0) 编辑
摘要: NameSyntaxDescription abs abs(x) Absolute value (per component). acos acos(x) Returns the arccosine of each component of x. all all(x) Test if all com 阅读全文
posted @ 2019-03-30 11:01 闵天 阅读(934) 评论(0) 推荐(0) 编辑