09 2013 档案

显存的一些知识
摘要:学习GPU编程近半个月了,一直专注与编程的手段、方法、技巧等细节,却还没有从宏观看一下GPU是个什么样子。GPU就是显卡,graphic processor unit的缩写,在早期主要用于视频加载、3D图形处理等显示方面的应用,特点是一个GPU里有很多运算单元可以同时工作,相比于CPU的双核或者4核是一大亮点。尽管GPU在高速缓存、寄存器数量、时钟频率等方面远不及CPU,但多核(上百个)优势如果被充分利用的话,相较于CPU依然可以取得明显的加速效果。因此,越来越多的人不再仅仅把GPU当成图形处理核心,而是通用计算核心,这就是GPGPU的来历。全球最大的GPU产商Nvidia公司在这方面特别积极 阅读全文

posted @ 2013-09-23 20:27 Leo Han 阅读(688) 评论(0) 推荐(0)

Cuda_bank-conflict
摘要:一直不太理解GPU共享缓存中所谓的bank conflict是什么意思,知道今天对共享缓存操作时,发现简简单单的一句话:temp[tdx] = cach4[7];对程序的运行时间竟然有0.05ms的影响!!是时候彻底弄清楚到底何谓bank conflict了。对于有八个memory-bank 的GPU,共享内存的存储方式如表一中所述。目前计算能力大于2.0的GPU中,大多有16个memory-bank.表一Memory Bank Architecture对于同一个wrap中的线程(一个wrap内包含了32个线程),访问共享存储器时,以half-wrap的形式分两次访问。同一half-wrap内 阅读全文

posted @ 2013-09-22 21:58 Leo Han 阅读(1570) 评论(0) 推荐(1)

翻译文章进展
摘要:本来打算每周通过翻译文章的方式精读一两篇文章的,可现在不禁打起了退堂鼓。第一个原因是,英语论文翻起来实在太过于吃力,先不说很多科技英语的特定表达方法我不太清楚,就是一般的行文组字,如何翻译成通顺连贯的汉语也要花费很长时间。第二个则是,并不是每一篇论文都值得花大力气去翻译,更直接的就是找不到一篇合适的文章来翻译,大牛写的文章或者太过先进根本看不懂,或者是综述性的文章,跟目前的项目没关系。更多的会议文章则显得撰写水平一般且“干货”太少,画个2个小时仔细读一下即可,浪费好几个晚上的时间去翻译实在不值。翻译了一篇CVPR的关于立体匹配的文章的前面一小部分,贴出来献丑了。也同时在这里发帖为证,放弃翻译这 阅读全文

posted @ 2013-09-17 21:36 Leo Han 阅读(372) 评论(0) 推荐(0)

一些CV界的好资源
摘要:对一个方向的深入研究,必须建立在广泛且有质量的阅读、领悟之上。研一的一年时间里,感觉虽然黄老师给我的任务并不重,课程压力也不大,但思想负担不轻。想在计算机视觉领域做出点东西,这一年是打基础、搞研究最重要的一年。抓得住现在,才抓得住未来。今天也找了一些计算机视觉领域的前沿阵地,有时间一定多看看。多学知识、多总结。资源分为三类,第一类是一些注明的计算机视觉研究中心:谷歌研究院: http://research.google.com/index.html斯坦福视觉研究中心:http://vision.stanford.edu/research.html中国视觉网:http://www.china-v 阅读全文

posted @ 2013-09-14 22:55 Leo Han 阅读(745) 评论(0) 推荐(0)

how processor caches work
摘要:对Gallery of Processor Cache Effects这篇文章的阅读总结。介绍了cache的工作方式,并通过一些小程序做实验进一步讲解和验证cache的工作方式导致的一些后果。以前很多不甚明了的关于高速缓存的知识点,有不少都被原文所提醒和点透,给优化程序速度带来了很多启发。 阅读全文

posted @ 2013-09-09 20:22 Leo Han 阅读(260) 评论(0) 推荐(0)

在VS2010中配置Cuda(Version 5.0及以上)
摘要:Cuda安装与配置。 阅读全文

posted @ 2013-09-04 14:02 Leo Han 阅读(346) 评论(0) 推荐(0)