摘要: 最近在读professional cuda c programming.第三章里有一些关于nvprof的内容.记录一下过程中遇到的问题. 本书的代码可以在这里找到. 线程束分化 GPU在控制流上相对简单,相比GPU它没有复杂的分支预测机制,一个warp中所有线程在同一周期内必须执行相同指令.如果一个 阅读全文
posted @ 2023-03-30 18:31 LinXiaoshu 阅读(1288) 评论(0) 推荐(0)