Romi-知行合一

轻轻的风轻轻的梦,轻轻的晨晨昏昏, 淡淡的云淡淡的泪,淡淡的年年岁岁。
  博客园  :: 首页  :: 新随笔  :: 订阅 订阅  :: 管理

随笔分类 -  并行计算

摘要:问题来源:在使用MPI时,将程序并行实现了,运行时需要在dos窗口下输入批处理命令,以完成程序的执行。如:mpiexec -localroot -n 6 d:/mpi/pro.exe但每次这样挺麻烦的,就将批处理命令写在bat文件中,需要运行时直接双击运行bat文件即可。但使用MPI实现的程序是软件功能的一部分,需要在软件使用过程中从软件中进行调用,实现MPI的并行处理,上面的方法就不可行了,上面的方法单独用还可以,但是要将功能集成在软件中,就需要另想办法了。解决办法:system函数函数原型:int system (const char* command);该函数作用是执行系统命令,syst 阅读全文

posted @ 2013-09-17 23:37 romi 阅读(2653) 评论(0) 推荐(0) 编辑

摘要:转载自:http://tech.it168.com/a2010/0722/1080/000001080895.sht在众多自然灾害中地震造成的人员伤亡数量和经济损失最大,近两年来中国汶川。从少量的建筑物的结构破坏,到城市中心或者大型国家社会经济基础建筑的完全摧毁。限于当前技术水平还不能实现有效的地震灾害预报预警,只能通过开展灾后救援,安置灾民和灾后重建等手段,减少灾害带来的生命和财产损失。房屋倒塌作为城镇区域受损程度的重要标志,其数量和分布能够直接反映灾区生命财产损失的情况。因此,快速获取受灾地区房屋倒塌信息,使应急救援在地震灾害后72小时内投送到关键位置是最为紧迫的需要。 1.项目应用背.. 阅读全文

posted @ 2012-11-22 11:33 romi 阅读(670) 评论(0) 推荐(0) 编辑

摘要:cuda几个月前接触过,当时只是了解大概,知道怎么用,现在重新看了《大规模并行处理器编程实践》这本书,书上讲的是第一代的cuda架构,现在的gpu经过了fermi都已经是开普勒架构了,我使用还是G80卡,看来得与时俱进了,这是后话了。今天用cuda时照着以前的思路,出现了问题。经解决后,这里总结如下:1.使用cuda,可以用在控制台应用程序中,也可以用于GUI中。用在GUI中时,和控制台应用程序一样将cuda计算部分写在函数内(.cu文件内,因为只有.cu文件才能经过nvcc编译),调用该函数即可。2.新建项目后,是没有加入nvcc编译器的,这时在自定义生成规则中加入CUDA(右键工程),如下 阅读全文

posted @ 2012-08-16 21:06 romi 阅读(3170) 评论(0) 推荐(0) 编辑

摘要:谷歌三大核心技术(二)Google MapReduce中文版 阅读全文

posted @ 2012-07-14 10:24 romi 阅读(1335) 评论(0) 推荐(0) 编辑

摘要:原文地址:http://blog.csdn.net/qazplm12_3/article/details/56497411。计算机的峰值为主频x4。2。计算机读取数组时,一次会读入一行,要最大限度的利用已读入的数据,减少频繁读写的次数。3。多线程内存共享,多进程需要消息传递来交换变量。4。利用管道在不同程序之间传递内容(可以是管道符|或mkfifo mypipe)5。平均不同节点的计算量,尽量做到负载平衡。6。数据分块是每块大小尽可能为cache的1/3。7。MPI_CHAR 为一个字符,但不一定是一个字节。8。在MPI_Init()之后再处理命令行参数。9。MPI_Recive()出现在MP 阅读全文

posted @ 2012-07-14 09:58 romi 阅读(821) 评论(0) 推荐(0) 编辑

摘要:MPI用于矩阵乘积,矩阵数据分块,主进程和从进程都进行计算 阅读全文

posted @ 2012-07-13 22:43 romi 阅读(6860) 评论(1) 推荐(1) 编辑

摘要:运行mpi程序命令 阅读全文

posted @ 2012-07-09 15:26 romi 阅读(8051) 评论(0) 推荐(0) 编辑

摘要:Windows下MPI的环境搭建,分别利用单机和机群进行圆周率π求值的测试 阅读全文

posted @ 2012-05-28 20:25 romi 阅读(9671) 评论(0) 推荐(0) 编辑

摘要:CUDA矩阵乘法结果的验证,计算结果准确性测试 阅读全文

posted @ 2012-05-17 21:59 romi 阅读(2445) 评论(0) 推荐(0) 编辑

摘要:CUDA矩阵乘法——利用共享存储器,将数据从全局存储区加载到共享存储区内,再进行计算能进一步提高性能 阅读全文

posted @ 2012-05-17 21:09 romi 阅读(4184) 评论(0) 推荐(2) 编辑

摘要:参照书上的示例写的代码,出现此种问题。没有其他的问题,就只有这一个问题,我想可能使cuda文件哪里出问题了,到底是哪里的问题呢?今天在吃饭时,考虑存储器模型,全局存储器和共享存储器时,默默计算一番,偶然想到一个块的共享存储器只有16KB(对于本人及其的显卡),而我分配的存储空间64*64*2,除以1024后,这样算只有8KB,但数据都是float(最初计算时当成byte再算,还是要脑子清醒啊!),所以是32KB,已经超过了能容纳的大小。所以出现此问题的原因是需要的存储器大小超过了实际有的大小。修改后,就没错误了。 阅读全文

posted @ 2012-05-17 20:30 romi 阅读(2569) 评论(0) 推荐(0) 编辑

摘要:CUDA矩形乘法——常规模型,对上篇错误的修改 阅读全文

posted @ 2012-05-17 20:23 romi 阅读(2863) 评论(0) 推荐(0) 编辑

摘要:VS2008+QT中使用CUDA的示例(矩阵相乘) 阅读全文

posted @ 2012-05-09 19:38 romi 阅读(4065) 评论(1) 推荐(0) 编辑

摘要:GPU 显存 阅读全文

posted @ 2012-04-25 14:39 romi 阅读(1275) 评论(0) 推荐(0) 编辑

摘要:CUDA之初体验——数组求和 利用cuda进行gpu并行计算的一个入门初窥 阅读全文

posted @ 2012-04-20 20:31 romi 阅读(8052) 评论(0) 推荐(0) 编辑

摘要:CUDA3.2 使用cuda的项目属性设置 阅读全文

posted @ 2012-04-20 17:54 romi 阅读(2851) 评论(0) 推荐(0) 编辑

摘要:CUDA3.2 + VS2008 编程环境配置 阅读全文

posted @ 2012-04-20 17:22 romi 阅读(2490) 评论(0) 推荐(0) 编辑