随笔分类 -  CUDA

profile
摘要:今天算是切身体会到nvcc编译器的坑爹了,真心在瞎编。对于这点,可以用nv的profile 反汇编出nvcc编译出的目标代码,若想和源码对应,则需加上-lineinfo编译选项。 在profile的individual kernel——perform computing analysis——inst 阅读全文

posted @ 2017-07-20 21:09 d神 阅读(210) 评论(0) 推荐(0)

access violation
摘要:昨晚重新换了一个思路写的mmp的代码,结果有bug,每次访问share_a是说access violation,详情就是访问out of range,但我检查来检查去发现逻辑上并没有错啊,没有访问超出范围啊,想了一个下午都没想出来,最后就自己想重新把share_a的定义写一遍,写的时候突然发现——是 阅读全文

posted @ 2016-08-20 20:12 d神 阅读(389) 评论(0) 推荐(0)

基于cuda的mmp的bug调试
摘要:程序初稿出来后,有这样几个bug: 1、内存访存超出范围 2、每次循环后,用于周转的寄存器tmp没有重置为零 3、将数据拷贝到sharedmemory后的第一次迭代数据不对。数据结果每次运行不一样,但是一个有限集。 针对第一个bug,是指针的使用上混乱了。mmp这个kernel中用到的指针有点多,且 阅读全文

posted @ 2016-08-09 21:44 d神 阅读(262) 评论(0) 推荐(0)

导航