随笔分类 - hpc
XCAT在虚拟机上部署系统
摘要:xcat更新到2.13了,老的manual很多都没用了。前一整子居然没搞成功,只好再来试一次。 官网也搬到了xcat.org。首先就是下core和dep包 分别是 xCAT Core Packages (xcat-core) 和 xCAT Dependency Packages (xcat-dep)
阅读全文
opencl初体验
摘要:总结一下,opencl的步骤差不多是这些先要获取平台的id clGetPlatformIDs(nPlatforms, platform_id, &num_of_platforms)然后获取设备id clGetDeviceIDs(platform_id[1], CL_DEVICE_TYPE_GPU, ...
阅读全文
矩阵对角化
摘要:numericalrecipe里一共讲了两种实数对称矩阵的对角化,jacobi法tred2生成上三角阵以后用tqli对角化前者稳定但慢易并行,后者较快但疑似不稳定,串行。花了一下午,一点点调试终于知道了第二种方法不稳定的原因在哪里 1 SUBROUTINE tred2(a,d,e,n...
阅读全文
如何查看cache信息
摘要:很多时候查不到本机cpu的cache信息。而了解这些信息,对于调优很有帮助查看1级缓存cache大小cat /sys/devices/system/cpu/cpu0/cache/index1/size查看能访问这个1级缓存的cpu编号cat /sys/devices/system/cpu/cpu0/cache/index1/shared_cpu_list查看1级缓存cache line的大小cat /sys/devices/system/cpu/cpu0/cache/index1/coherency_line_size查看1级缓存cache set的数目cat /sys/devices/sys
阅读全文
oprofile 安装使用
摘要:ubuntu上要编译安装oprofile。现在版本(0.9.9)的oprofile的编译需要binutil-dev libpopt-devapt-get install binutil-dev libpopt-dev然后./configure make make install安装完以后1.执行opcontrol --init启动加载oprofile模块2.opcontrol --no-vmlinux3.(可选)opcontrol --event=L2_CACHE_MISS:500 查看cache miss率,增加监听事件4.opcontrol --start 启动op5.运行待检测程序(必须
阅读全文
gromacs, quake III和vrsqrtps
摘要:看标题大家可能觉得三个词汇风马牛不相及,第一个是解蛋白质分子动力学的软件,第二个是上三代宅男最爱雷神之锤,第三个则是一个存在于IntelSSE及AVX中的一个指令,他的作用是快速求平方根的倒数。起因是这样子的。某天闲着没事,跑去benchmarksgame.alioth.debian.org上看到了万年被压在fortran身体下蹂躏的c++居然翻身了。最不可思议的是,在fortran长项上的多体运算nbody居然被c++拉了一大截性能下来(2倍,5千万步,fortran用时19秒,C++用时9.59秒)。本着fortran居然能被c++搞倒根本是不可能的事情的信念,我开始出发了。好在他们提供了
阅读全文
lsf安装后配置
摘要:先要引用变量[root@mgmt3 lsf9]# source conf/profile.lsf然后在本地执行hostsetup[root@mgmt3 lsf9]# ./hostsetup --top="/gpfs/lsf9" --boot="y" 然后编辑[root@mgmt3 lsf9]# vi conf/lsf.cluster.platformBegin HostHOSTNAME model type server r1m mem swp RESOURCES #Keywords#apple Sparc5S SUNSOL 1 ...
阅读全文
lsf安装
摘要:lsf安装一共需要这么几个文件[root@mgmt3 lsfinstall]# ls -lhtotal 262M-rw-r--r-- 1 root root 157M Feb 27 14:39 lsf9.1_linux2.6-glibc2.3-x86_64.tar.Z-rw-r--r-- 1 root root 106M Feb 27 13:20 lsf9.1_lsfinstall_linux_x86_64.tar.Z-rw-r--r-- 1 root root 82 Feb 27 13:46 platform_lsf_std_entitlement.dat其中,lsf9.1_lsfins..
阅读全文
gpfs安装细节
摘要:GPFS on Redhat:安装Redhat 6 服务器,一共五台,头节点,子节点两台,io节点两台- node01- node02- ionode01- ionode02- mgmt3磁盘配置/gpfsdisk/nsdfile (GPFSDISK)这是虚拟机上的文件,用来模拟磁盘,物理机上可以用真实磁盘代替/dev/sda (OS disk)[root@mgmt3 gpfs3416_x86_64]# ls -lhtrtotal 11M-rw-r--r-- 1 root root 92K Sep 18 23:12 gpfs.msg.en_US-3.4.0-16.noarch.rpm-rw-.
阅读全文
xCAT 2.7.6 dns解析
摘要:之前一直遇到这个问题[root@mgmt3 ~]host node01;; connection timed out; trying next origin;; connection timed out; no servers could be reached[root@mgmt3 ~]nslookup node01;; connection timed out; trying next origin[root@mgmt3 ~]dig @192.168.10.254 node01; <<>> DiG 9.8.2rc1-RedHat-9.8.2-0.10.rc1.el6
阅读全文
xcat无法连接服务器
摘要:tabdump siteUnable to open socket connection to xcatd daemon on localhost:3001.Verify that the xcatd daemon is running and that your SSL setup is correct.Connection failure: IO::Socket::SSL: Timeout at /opt/xcat/lib/perl/xCAT/Client.pm line 159.经常遇到这个问题,网上找了很久都没发现原因。http://sourceforge.net/tracker/?f
阅读全文
xcat网络无盘启动——添加自定义安装包
摘要:最近在安装包含chess3的网络无盘启动包。发现手动要调整的太多,还是使用xcat更方便一点。我们可以发现,在xcat的网络无盘启动中,其实是把/install/netboot/os/arch/compute/rootimg下的东西打了个包,通过查看genimage中产生的信息,我们也可以发现是通过yum --installroot=/install/netboot/os/arch/compute/rootimg将对应的包装到这个目录下的。随后再通过packimage打包。那这样子事情就比较简单的了,通过更改rootimg下的对应文件就能够把更改做到无盘启动的文件包里。对于编译安装的软件直接复
阅读全文
xcat网络无盘启动
摘要:首先,先到$osname目录下找genimage/opt/xcat/share/xcat/netboot/$osname-i 网卡,如eth1-n 网络驱动,如e1000-o 系统名,如rhel5.7-p 组名,这里是compute./genimage -i eth1 -n e1000 -o rhel5.7 -p compute以后,生成image文件随后到/install/netboot/rhel5.7/x86_64/compute/rootimg/etc目录下修改fstab加上compute_x86_64 / tmpfs rw 0 1并且把/挂载点删除。然后用packimage -o rh
阅读全文
并行编程——MPI/OPENMP混合编程
摘要:在大规模节点间的并行时,由于节点间通讯的量是成平方项增长的,所以带宽很快就会显得不够。所以一种思路增加程序效率线性的方法是用MPI/OPENMP混合编写并行部分。这一部分其实在了解了MPI和OPENMP以后相对容易解决点。大致思路是每个节点分配1-2个MPI进程后,每个MPI进程执行多个OPENMP线程。OPENMP部分由于不需要进程间通信,直接通过内存共享方式交换信息,不走网络带宽,所以可以显著减少程序所需通讯的信息。Fortran:Program hello use mpi use omp_lib Implicit None Integer :: myid,numprocs,rc,...
阅读全文
并行编程——OPENMP
摘要:和MPI支持在分布式内存机器上运行不一样,OPENMP只能在共享内存机器上运行。这一局限性带来的好处就是编程时相对好处理一点。对于天然并行的代码可以不做过多处理就能并行,而MPI则需要消息传递。另外,MPI的消息传递会带来带宽(系统和网络)上的要求,一旦并行节点数增多则会阻塞。这点也是OPENMP的一个优势。并行开始及结束声明:Fortran 77/90:!$OMP PARALLEL 代码区!$OMP END PARALLELC/C++:#pragma omp parallel { 代码区 } 某个循环区块的并行Fortran 77/90:!$OMP DO [clause ......
阅读全文
并行编程——MPI
摘要:MPI是Message Passing Interface的简称,通过这个协议可以在各个进程——尤其是分布式内存进程——间能够进行通信,交流消息共同完成一个任务。进行mpi编程的基本流程如下首先要载入头文件Fortran 77: include 'mpif.h' Fortran 90: use mpi C/C++: #include "mpi.h" 第二步是初始化MPI环境Fortran 77/90: Call MPI_INIT(ierror)其中integer ierrorC: int MPI_Init(int *argc, char ***argv);
阅读全文
xcat在虚拟机上部署系统
摘要:现在vmware上建立管理节点mgmt,内网ip设为192.168.1.1,对应网卡为eth1,外网ip设为192.168.8.50,对应网卡为eth0然后下载xcat的两个包,xcat-core-2.6.10.tar.bz2xcat-dep-201202211937.tar.bz2上传到服务器上,解压缩之后。cd xcat-dep/rh5/x86_64./mklocalrepo.shcd http://www.cnblogs.com/..cd xcat-core/./mklocalrepo.sh建立本地的安装源,然后挂载系统镜像到cdrom,通过yum install xCAT.x86_64
阅读全文
lustre快速安装
摘要:最近看了一下lustre,快速安装了一下,记录在这里。首先去这里下载对应的服务器版本的包。系统版本是rhel5.4 x86_64。既然是服务器用的并行文件系统,以稳定为主,我这里使用lustre1.8.7,对应的文档在这里server要可能要用到的包e2fsprogs-1.41.12.2.ora1-0redhat.rhel5.x86_64.rpmkernel-2.6.18-194.17.1.el5_lustre.1.8.7.x86_64-ext4.rpmkernel-2.6.18-194.17.1.el5_lustre.1.8.7.x86_64.rpmlustre-1.8.7-2.6.18_1
阅读全文