随笔分类 -  GPU

摘要:安装cuda经常会遇到安装失败的问题,原因大部分都是由于驱动不一致引起的,接下来我们分两步讲解 1. 安装驱动失败 原因:nvidia官网提供的驱动都是通用的,针对特殊设备可能出现不兼容问题,方法很简单,直接去联想官网下载最新驱动,可通过电脑的SN(笔记本底部)序列号查找对应的驱动 安装步骤:右键开 阅读全文
posted @ 2018-11-13 16:51 BlueOceans 阅读(3885) 评论(0) 推荐(0)
摘要:CUB库 https://nvlabs.github.io/cub/index.html 阅读全文
posted @ 2018-10-16 09:05 BlueOceans 阅读(206) 评论(0) 推荐(0)
摘要:http://www.geforce.cn/hardware/desktop-gpus/geforce-gtx-480/architecture http://cache.baiducontent.com/c?m=9d78d513d99607e54fece4780714c0676943f0122ba 阅读全文
posted @ 2018-01-17 15:37 BlueOceans 阅读(245) 评论(0) 推荐(0)
摘要:CUDA Convolution https://www.evl.uic.edu/sjames/cs525/final.html Improve Image Processing Using GPU Computing on Mali™ https://www.arm.com/files/event 阅读全文
posted @ 2018-01-16 09:21 BlueOceans 阅读(1159) 评论(0) 推荐(0)
摘要:利用shared memory计算,并避免bank conflict;通过每个block内部规约,然后再把所有block的计算结果在CPU端累加 代码: 阅读全文
posted @ 2017-11-06 22:48 BlueOceans 阅读(707) 评论(0) 推荐(0)
摘要:采用shared memory加速 代码 合并访存:tile_A按行存储,tile_B按列存储,sum=row_tile_A * row_tile_B 阅读全文
posted @ 2017-11-06 21:28 BlueOceans 阅读(726) 评论(0) 推荐(0)
摘要:本方法采用简单的单线程计算每组行和列乘加运算 代码如下: 阅读全文
posted @ 2017-11-05 21:54 BlueOceans 阅读(2266) 评论(0) 推荐(0)
摘要:文件目录: cudaTest |--utils.cu |--utils.h |--squaresum.cu |--squaresum.h |--test.cpp |--CMakeLists.txt 编译命令: $cd /root/cudaTest $mkdir build $cd build $cm 阅读全文
posted @ 2017-11-05 17:58 BlueOceans 阅读(7557) 评论(0) 推荐(0)
摘要:胡文美教授 http://www.gpuworld.cn/article/show/463.html 阅读全文
posted @ 2017-11-05 10:38 BlueOceans 阅读(507) 评论(0) 推荐(0)
摘要:watch -n 1 -d nvidia-smi 间隔1秒刷新 阅读全文
posted @ 2017-10-24 20:04 BlueOceans 阅读(20870) 评论(0) 推荐(0)