随笔分类 -  并行计算

CUDA相关
摘要:算法设计:基数排序CUDA程序里应当尽量避免递归,因而在迭代排序算法里,基数排序通常作为首选。1.1 串行算法实现十进制位的基数排序需要考虑数位对齐问题,比较麻烦。通常实现的是二进制位的基数排序。整体思路:与当前位做AND运算,按照0.....1的顺序重置序列,直到所有位迭代完毕。sort_tmp数... 阅读全文
posted @ 2015-08-08 00:38 Physcal 阅读(2452) 评论(1) 推荐(0) 编辑
摘要:算法设计:直方图统计直方图频数统计,也可以看成一个字典Hash计数。用处不是很多,但是涉及CUDA核心操作:全局内存、共享内存、原子函数。1.1 基本串行算法这只是一个C语言练习题。#define MAXN 1005#define u32 unsigned int__host__ void coun... 阅读全文
posted @ 2015-08-05 17:26 Physcal 阅读(1454) 评论(0) 推荐(0) 编辑
摘要:为什么需要GPU 几年前我启动并主导了一个项目,当时还在谷歌,这个项目叫谷歌大脑。该项目利用谷歌的计算基础设施来构建神经网络。 规模大概比之前的神经网络扩大了一百倍,我们的方法是用约一千台电脑。这确实使深度学习取得了相当大的进展。用到相当多的 计算机。不久之后我发现,之前我并没意识到,用一千台电脑是 阅读全文
posted @ 2015-07-13 19:17 Physcal 阅读(6331) 评论(1) 推荐(1) 编辑