摘要: Cuda的编译过程,Device memory和 shared momery 阅读全文
posted @ 2016-05-09 10:32 stormHan 阅读(428) 评论(0) 推荐(0)
摘要: 由于刚刚开始学习Cuda,还没有整理出一个完整的Cuda类,只是在Nvidia提供的kenerl架构上做修改。 但用于初体验GPU给我们带来的好处也绰绰有余了。 直接贴代码: 代码中,总过使用了CPU的计算和两种GPU的运算,最终的运行结果如下: 可以明显的看出,GPU的运行速度比CPU快很多,并且 阅读全文
posted @ 2016-05-06 21:39 stormHan 阅读(7933) 评论(0) 推荐(0)
摘要: 前言: 由于一直在学习图形学,很多时候,图形学中的计算,如最近碰到的问题,计算随机点的中垂面,每个点的计算K近邻树,都是独立的。如果用GPU并行加速,可能会有好的提速效果。 再加上实验室已有学长对这个领域有比较深入的了解,故想开始学CUDA。 CPU 可以类比于一个强壮的男人,而GPU则是一群小孩, 阅读全文
posted @ 2016-05-05 21:33 stormHan 阅读(208) 评论(0) 推荐(0)
摘要: 分治法(divide and conquer) Merge sort; cal X^n; Fabonacci : F(n) = F(n - 1) + F(n - 2)(F(0) = 0, F(1) = 1;) 1,如果直接递归,可以看出,递归树不对称,且下降的速度是线性的,Time将 是指数级别的T 阅读全文
posted @ 2016-03-29 13:31 stormHan 阅读(141) 评论(0) 推荐(0)
摘要: 1,关于算法的一些符号 O: 表示比它低阶的所有函数集;O(n^3) = n^2; O(g(n))(代表一个函数集) = f(n) f(n ) = O(n) + n^2; O规定了上界 反之, Ω()与O()相反,规定了上届 θ()是O()和Ω()的交集,n^2 + O(n^2) = θ(n^2); 阅读全文
posted @ 2016-03-27 14:49 stormHan 阅读(169) 评论(0) 推荐(0)
摘要: //算法是一个程序员的基础,也是重中之重,我希望能重头系统的学习一遍算法。 Analysis of Algorithm 在程序领域,what's more important than the perfermance? 正确性,简洁性,健壮性。features,模块化,security, user 阅读全文
posted @ 2016-03-26 17:55 stormHan 阅读(244) 评论(0) 推荐(0)