上一页 1 2 3 4 5 6 7 ··· 14 下一页
摘要: 如果于鏊这样的问题:描述是:“您上次已将进行的搜狗输入法的安装或卸载,操作要求重启。您在重启之后才能继续新的输入法安装卸载程序”win+R输入:regedit按照如下路径找到“SogouInput”HKEY_LOCAL_MACHINE\SoftWare\Wow6432Node\SogouInput\... 阅读全文
posted @ 2015-03-31 20:10 青竹居士 阅读(1946) 评论(0) 推荐(0) 编辑
摘要: http://gpgpu.org/static/developer/cudpp/rel/cudpp_1.1/html/index.html 阅读全文
posted @ 2015-03-31 17:31 青竹居士 阅读(186) 评论(0) 推荐(0) 编辑
摘要: cudaMemcpy2D( d_A, // 目的指针 d_pitch, // 目的pitch bmp1, // 源指针 sizeof(int)*2, // 源数据pitch sizeof(int)*2, // 数据拷贝宽度 2, // 数据拷贝... 阅读全文
posted @ 2015-03-31 16:00 青竹居士 阅读(4419) 评论(0) 推荐(0) 编辑
摘要: 概要cudaError_t cudaMallocPitch( void** devPtr,size_t* pitch,size_t widthInBytes,size_t height )说明向设备分配至少widthInBytes*height字节的线性存储器,并以*devPtr的形式返回指向所分配... 阅读全文
posted @ 2015-03-31 15:56 青竹居士 阅读(2222) 评论(0) 推荐(0) 编辑
摘要: 下载链接http://yunpan.cn/cZ42hEEQcYMMz (提取码:16a1) 阅读全文
posted @ 2015-03-30 15:10 青竹居士 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 1、设置线程数目定义如下:void omp_set_num_threads(int num_threads);通过该函数来指定其后用于并行计算的线程数目,其中参数num_threads就是指定的线程数目。2、获取线程数目其定义如下:int omp_get_num_threads();通过该函数可以获... 阅读全文
posted @ 2015-03-30 10:00 青竹居士 阅读(1049) 评论(0) 推荐(0) 编辑
摘要: Ubuntu下的makefile: 1 # /******************************************************************************************** 2 # * File: Makefile 3 # * ... 阅读全文
posted @ 2015-03-25 15:15 青竹居士 阅读(228) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2015-03-25 11:33 青竹居士 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 安装gcc、g++sudo apt-get install make gcc g++查看g++版本g++--version 阅读全文
posted @ 2015-03-25 10:04 青竹居士 阅读(203) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2015-03-24 20:47 青竹居士 阅读(3) 评论(0) 推荐(0) 编辑
摘要: Getting aCC Error:name followed by "::" must be a class or namespace name"原始是这样子的:Using namespace stdext::hash_map;修改如下:Using namespace std; 阅读全文
posted @ 2015-03-23 17:00 青竹居士 阅读(2262) 评论(0) 推荐(0) 编辑
摘要: void acc_set_device_num( int, acc_device_t );描述在指定类型的所有设备中, acc_set_device_num 告诉运行时库环境用哪一个设备。如果 devicenum 的值为负,运行时环境将恢复到编译器自行定义的默认行为。如果第二个参数是零,选定的设备编... 阅读全文
posted @ 2015-03-23 15:45 青竹居士 阅读(804) 评论(0) 推荐(0) 编辑
摘要: getnumdevices.c代码 1 /* 文件名: getnumdevices.c 2 * 功能 : 测试函数acc_get_num_devices(.) 3 */ 4 #include 5 #include "openacc.h" 6 int main() 7 { 8 int num = -8... 阅读全文
posted @ 2015-03-23 15:28 青竹居士 阅读(403) 评论(0) 推荐(0) 编辑
摘要: 格式C 或 C++:int acc_get_num_devices( acc_device_t );描述例程 acc_get_num_devices 返回主机上指定类型的加速器设备数量。输入参数说明对哪种类型的设备计数。 1 /* 文件名: getnumdevices.c 2 * 功能 : 测试函数... 阅读全文
posted @ 2015-03-23 15:17 青竹居士 阅读(554) 评论(0) 推荐(0) 编辑
摘要: 对 C 和 C++,本章讲述的运行时库例程的原型保存在一个名为 openacc.h 的头文件中。所有的库例程都是用“ C”连接的 extern 函数。这个文件中定义1: 本章中所有例程的原型。 这些原型中使用的所有数据类型,包括一个描述加速器类型的枚举类型。 acc_async_noval 和... 阅读全文
posted @ 2015-03-23 15:09 青竹居士 阅读(356) 评论(0) 推荐(0) 编辑
摘要: timeinfo1.c代码 1 #include 2 #define N 100 3 int main() 4 { 5 int A[N]; 6 #pragma acc kernels 7 { 8 for(int i=0; i 2 #define N 100 3... 阅读全文
posted @ 2015-03-23 14:13 青竹居士 阅读(1380) 评论(0) 推荐(0) 编辑
摘要: 1 #include 2 #include 3 #include 4 5 int main( int argc, char* argv[] ) 6 { 7 int n; /* size of the vector */ 8 float *restrict a; ... 阅读全文
posted @ 2015-03-23 11:25 青竹居士 阅读(594) 评论(0) 推荐(0) 编辑
摘要: 在西雅图超级计算大会(SC11)上发布了新的基于指令的加速器并行编程标准,既OpenACC。这个开发标准的目的是让更多的编程人员可以用到GPU计算,同时计算结果可以跨加速器使用,甚至能用在多核CPU上。出于显而易见的原因,NVIDIA在大力推广和支持OpenACC。但事实上PGI和Cray才是最早推... 阅读全文
posted @ 2015-03-22 15:28 青竹居士 阅读(4187) 评论(0) 推荐(0) 编辑
摘要: 引言:什么是基于指令的移植方式呢?首先我这里说的移植可以理解为把原先在CPU上跑的程序放到像GPU一样的协处理器上跑的这个过程。在英文里可以叫Porting。移植有两种方式:一种是使用CUDA或者OpenCL来重新设计代码,然后使用硬件厂商提供的编译器来编译;一种是使用OpenACC或者OpenHM... 阅读全文
posted @ 2015-03-22 15:20 青竹居士 阅读(839) 评论(0) 推荐(0) 编辑
摘要: 一步步做程序优化【1】讲一个用于OpenACC优化的程序分析下A,B,C为三个矩阵,A为m*n维,B为n*k维,C为m*k维,用A和B来计算C,计算方法是:C = alpha*A*B + beta*C。它的程序如下: 1 // C = alpha*A*B + beta*C 2 void mySgem... 阅读全文
posted @ 2015-03-22 15:12 青竹居士 阅读(916) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 14 下一页