Romi-知行合一

轻轻的风轻轻的梦,轻轻的晨晨昏昏, 淡淡的云淡淡的泪,淡淡的年年岁岁。
  博客园  :: 首页  :: 新随笔  :: 订阅 订阅  :: 管理

2012年5月17日

摘要: CUDA矩阵乘法结果的验证,计算结果准确性测试 阅读全文

posted @ 2012-05-17 21:59 romi 阅读(2450) 评论(0) 推荐(0) 编辑

摘要: CUDA矩阵乘法——利用共享存储器,将数据从全局存储区加载到共享存储区内,再进行计算能进一步提高性能 阅读全文

posted @ 2012-05-17 21:09 romi 阅读(4190) 评论(0) 推荐(2) 编辑

摘要: 参照书上的示例写的代码,出现此种问题。没有其他的问题,就只有这一个问题,我想可能使cuda文件哪里出问题了,到底是哪里的问题呢?今天在吃饭时,考虑存储器模型,全局存储器和共享存储器时,默默计算一番,偶然想到一个块的共享存储器只有16KB(对于本人及其的显卡),而我分配的存储空间64*64*2,除以1024后,这样算只有8KB,但数据都是float(最初计算时当成byte再算,还是要脑子清醒啊!),所以是32KB,已经超过了能容纳的大小。所以出现此问题的原因是需要的存储器大小超过了实际有的大小。修改后,就没错误了。 阅读全文

posted @ 2012-05-17 20:30 romi 阅读(2577) 评论(0) 推荐(0) 编辑

摘要: CUDA矩形乘法——常规模型,对上篇错误的修改 阅读全文

posted @ 2012-05-17 20:23 romi 阅读(2867) 评论(0) 推荐(0) 编辑