摘要:
http://www.opengpu.org/forum.php?mod=viewthread&tid=2635 阅读全文
posted @ 2013-02-19 22:58
waytofall
阅读(305)
评论(0)
推荐(0)
摘要:
其实这两天一直不知道什么叫bank conflict冲突,这两天因为要看那个矩阵转置优化的问题,里面有讲到这些问题,但是没办法,为了要看懂那个bank conflict冲突,我不得不去找资料,说句实话我现在不是完全弄明白,但是应该说有点眉目了,现在我就把网上找的整理一下,放在这边,等哪天完全弄明白了我就在修改里面的错误。Tesla的每个SM拥有16KB共享存储器,用于同一个线程块内的线程间通信。为了使一个half-warp内的线程能够在一个内核周期中并行访问,共享存储器被组织成16个bank,每个bank拥有32bit的宽度,故每个bank可保存256个整形或单精度浮点数,或者说目前的ba.. 阅读全文
posted @ 2013-02-19 14:04
waytofall
阅读(3333)
评论(0)
推荐(0)

浙公网安备 33010602011771号