CUDA跑MNIST,加速
摘要:
之前用CUDA写的版本,竟然还不如CPU。 经过好几次的尝试,得到两点经验: 1. CUDA的kernel不需要写得硕大无比。写大了之后,block数和thread数反而不好调整(之前都没有用上block),另外就是会导致数据管理非常复杂。kernel搞成细粒度之后好像也没那么多的影响。 2. 训练 阅读全文
posted @ 2016-10-11 20:40 萝卜头Lee 阅读(472) 评论(0) 推荐(0)
浙公网安备 33010602011771号