access violation
昨晚重新换了一个思路写的mmp的代码,结果有bug,每次访问share_a是说access violation,详情就是访问out of range,但我检查来检查去发现逻辑上并没有错啊,没有访问超出范围啊,想了一个下午都没想出来,最后就自己想重新把share_a的定义写一遍,写的时候突然发现——是使用移位操作时没有用括号括起来导致表达式结果不一样,即:
T2* share_a = &smem[threadIdx.x + (threadIdx.y<<7)]与T2* share_a = &smem[threadIdx.x + threadIdx.y<<7]结果不一样,因为移位运算符的优先级比加法运算符的优先级低。
浙公网安备 33010602011771号