摘要: 错误处理 接收错误信息 定义一个cudaError_t类型的变量来接收错误信息 cudaError_t err; 获取错误信息的字符串 cudaGetErrorString(err); 使用方法: cout<<cudaGetErrorString(err)<<endl; 获取核函数执行后最后一次错误 阅读全文
posted @ 2023-01-31 22:18 Laplace蒜子 阅读(263) 评论(0) 推荐(0)
摘要: nsys分析应用程序 命令行 nsys profile --stats=true ./CUDA程序 说明:生成的报告文件不会覆盖原来的报告文件,生成名称为report1,report2... 内容 CUDA API统计信息 CUDA核函数的统计信息 CUDA内存操作统计信息(时间和大小) 阅读全文
posted @ 2023-01-31 20:11 Laplace蒜子 阅读(288) 评论(0) 推荐(0)