上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 22 下一页

2015年7月24日

计算机时间复杂度和空间复杂度

摘要: 首先了解一下几个概念。一个是时间复杂度,一个是渐近时间复杂度。前者是某个算法的时间耗费,它是该算法所求解问题规模n的函数,而后者是指当问题规模趋向无穷大时,该算法时间复杂度的数量级。当我们评价一个算法的时间性能时,主要标准就是算法的渐近时间复杂度,因此,在算法分析时,往往对两者不予区分,经常是将渐近... 阅读全文

posted @ 2015-07-24 15:35 袁军峰 阅读(4111) 评论(0) 推荐(0)

2015年7月12日

CUDA学习笔记(二)【转】

摘要: 来源:http://luofl1992.is-programmer.com/posts/38847.html编程语言的特点是要实践,实践多了才有经验。很多东西书本上讲得不慎清楚,不妨自己用代码实现一下。作为例子,我参考了书本上的矩阵相乘的例子,这样开始写代码,然后很自然地出现了各种问题。以下的内容供... 阅读全文

posted @ 2015-07-12 12:08 袁军峰 阅读(472) 评论(0) 推荐(0)

CUDA学习笔记(一)【转】

摘要: CUDA编程中,习惯称CPU为Host,GPU为Device。编程中最开始接触的东西恐怕是并行架构,诸如Grid、Block的区别会让人一头雾水,我所看的书上所讲述的内容比较抽象,对这些概念的内容没有细讲,于是在这里作一个整理。Grid、Block和Thread的关系Thread :并行运算的基本单... 阅读全文

posted @ 2015-07-12 11:56 袁军峰 阅读(269) 评论(0) 推荐(0)

2015年7月11日

CUDA Thread Indexing

摘要: 1D grid of 1D blocks__device__ int getGlobalIdx_1D_1D(){return blockIdx.x *blockDim.x + threadIdx.x;}1D grid of 2D blocks__device__ int getGlobalIdx_1... 阅读全文

posted @ 2015-07-11 18:59 袁军峰 阅读(287) 评论(0) 推荐(0)

2015年7月10日

Intel MKL函数,如何得到相同的计算结果?【转】

摘要: 在运行程序时,我们总希望多次运行的结果,是完全一致,甚至在不同的机器与不同的OS中,程序运行的结果每一位都完全相同。事实上,程序往往很难保证做到这一点。 为什么呢? 我们先看一个简单的例子: 当程序使用单精度或者双精度的浮点数时, 浮点数有一定的精度的限制。 单精度的浮点数,使用23位二进制表示的尾... 阅读全文

posted @ 2015-07-10 17:50 袁军峰 阅读(1013) 评论(0) 推荐(1)

2015年7月5日

CUDA编程

摘要: 目录:1.什么是CUDA2.为什么要用到CUDA3.CUDA环境搭建4.第一个CUDA程序5. CUDA编程5.1. 基本概念5.2. 线程层次结构5.3. 存储器层次结构5.4. 运行时API5.4.1. 初始化5.4.2. 设备管理5.4.3. 存储器管理5.4.3.1. 共享存储器5.4.3.... 阅读全文

posted @ 2015-07-05 11:51 袁军峰 阅读(6542) 评论(0) 推荐(0)

2015年7月4日

GPU(CUDA)学习日记(十一)------ 深入理解CUDA线程层次以及关于设置线程数的思考

摘要: GPU线程以网格(grid)的方式组织,而每个网格中又包含若干个线程块,在G80/GT200系列中,每一个线程块最多可包含512个线程,Fermi架构中每个线程块支持高达1536个线程。同一线程块中的众多线程拥有相同的指令地址,不仅能够并行执行,而且能够通过共享存储器(Shared memory)和... 阅读全文

posted @ 2015-07-04 16:05 袁军峰 阅读(5183) 评论(0) 推荐(0)

2015年6月29日

linux下shell显示-bash-4.1#不显示路径解决方法

摘要: 在linux shell中不显示路径了,显示为-bash-4.1#用起来很不方便。如何改为显示路径的shell呢?步骤如下:vim ~/.bash_profile(不用管.bash_profile这个文件有几个,自己新建一个也是可以的)在最后加上export PS1='[\u@\h \W]\$'然后... 阅读全文

posted @ 2015-06-29 10:09 袁军峰 阅读(226) 评论(0) 推荐(0)

2015年6月26日

linux配置java环境变量(详细)

摘要: 一. 解压安装jdk在shell终端下进入jdk-6u14-linux-i586.bin文件所在目录,执行命令 ./jdk-6u14-linux-i586.bin 这时会出现一段协议,连继敲回车,当询问是否同意的时候,输入yes,回车。之后会在当前目录下生成一个jdk1.6.0_14目录,你可以将它... 阅读全文

posted @ 2015-06-26 19:38 袁军峰 阅读(308) 评论(0) 推荐(0)

2015年6月22日

CUDA中的流与事件

摘要: 流:CUDA流很像CPU的线程,一个CUDA流中的操作按顺序进行,粗粒度管理多个处理单元的并发执行。 通俗的讲,流用于并行运算,比如处理同一副图,你用一个流处理左边半张图片,再用第二个流处理右边半张图片,这两个流中的代码同时执行,加快了处理速度。事件:记录CUDA事件是CUDA流中应用程序跟踪... 阅读全文

posted @ 2015-06-22 17:46 袁军峰 阅读(1488) 评论(0) 推荐(0)

上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 22 下一页

导航