摘要:
参考文档: CUDA C++ Best Practices Guide 持续更新中。。。 指令优化 使用数学库 在速度胜过精度的情况时,可以考虑使用数学库函数接口。函数名称前带有__下划线的函数名,此类函数在硬件级别上的映射,速度更快,精度稍低。例如:__sinf(x) 另请注意,每当计算同一参数的 阅读全文
摘要:
https://developer.nvidia.com/zh-cn/blog/cuda-performance-guide-cn/ 英伟达官方提供的文档: 2. CUDA C++ 最佳实践指南 1. 计时 cuda核函数执行时间可以使用CPU计时器或GPU计时器实现,任何 CPU 计时器都可用于测 阅读全文