摘要:参考: https://blog.csdn.net/qq_39779233/article/details/128215517 error while loading shared libraries: libxml2.so.2: cannot open shared object file 解决方
阅读全文
摘要:本文操作步骤与 aarch64架构CPU下Ubuntu系统环境源码编译pytorch-gpu-2.0.1版本大致相同,只是CPU架构不同而已,因此这里只记录不同的地方。 重点: 一个个人心得,那就是要编译pytorch源码最好是选择docker环境,因为这种环境下配置比较纯净,一定要避免那种自己使用
阅读全文
摘要:本篇讲的重点是如何拉取带有cuda和cudnn的docker镜像,因此这些的镜像源的频道为NVIDIA: 官方地址: https://hub.docker.com/r/nvidia/cuda 根据官方资料我们知道NVIDIA的docker的tag分为三类: base版本、runtime版本、deve
阅读全文
摘要:拉取不同CPU架构下ubuntu22.04镜像: aarch64 (arm v8) CPU架构: docker pull --platform=linux/aarch64 ubuntu:22.04 x86_64 CPU架构: docker pull --platform=linux/x86_64 u
阅读全文
摘要:准备事项: 1. pytorch源码下载: 源码的官方地址: https://github.com/pytorch/pytorch 但是这里我们不能简单的使用git clone命令下载,因为pytorch项目依赖着很多的其他项目的代码,而其他的项目往往又依赖着另外一些项目代码,因此这里我们需要使用下
阅读全文
摘要:看到一个帖子: https://www.zhihu.com/question/478601948/answer/2060210740 作为一个比较传统的中国人来说对中医药是有着家国情怀的,是深深的情感的,但是看着现在中医药领域的发展现状也是有些担心的,也是这里就记录一些。 随着中国开始学习西方科技文
阅读全文
摘要:https://www.zhihu.com/question/492924320/answer/2806020423 发现了这么一个神奇的网站: https://www.bishehub.com/custom.html 本人也是搞了十多年的计算机方向了,可以说不管自己是读本科还是读硕士甚至读博士的时
阅读全文
摘要:3年前曾经写过关于分布式环境下batch normalization是否需要特殊实现的讨论:batch normalization的multi-GPU版本该怎么实现? 【Tensorflow 分布式PS/Worker模式下异步更新的情况】 当时我给出的观点就是在多卡环境下batch normaliz
阅读全文
摘要:建议参考原文: https://www.volcengine.com/docs/6535/78310 一直都在使用超算的GPU集群,但是从来没有实际操作过,虽然在自己的个人的三台主机上安装过小型的MPI集群,但是毕竟没有实际超算平台的构建经验,比如NCCL的超算平台上的安装及配置,InfiniBan
阅读全文
摘要:看帖有感: 地址:https://www.zhihu.com/question/609230832/answer/3102286500 搞了十多年的AI,虽然没有啥成果但是心得体会却有一些,看到了上面的帖子就有写想法要说。前天,也就是本月的25号,我所在的高校研究所开期末会,其中师母说过这样一句话,
阅读全文
摘要:看到帖子: https://www.zhihu.com/question/54483237/answer/2425730074 其实这也是我所想说的一个问题,那就是国内的教材太烂了,甚至感觉在侮辱智商,这样的教材简直是误人子弟。 我也是在985、211大学读过书的人,必须要说这么一个事情,那就是国家
阅读全文
摘要:看帖子有感: https://www.zhihu.com/question/604366728/answer/3072117214 在这里我并不想谈妲己和纣王的那些事情,毕竟在我看来这种烂事情在各行各业都是存在的,之所以学术领域爆出这样的事情就要人反应如此巨大,我想这可能还是世人把学术领域想的太完美
阅读全文
摘要:网上看到这样的帖子: https://www.zhihu.com/question/609008408/answer/3130831897 我个人搞了十多年的计算机,其中大部分时间都是搞AI相关,10多年前的时候就学过cuda编写bp模型,可以说算得上国内这领域的老鸟了,前段时间阴差阳错的成为了东北
阅读全文
摘要:网上看到了这个帖子: https://www.zhihu.com/question/607452791/answer/3121400400 国家的经济发展主要就是加快资金流动促进生产资料的重新分配,在这过程中还要实现一定的政府正向收支,主要的采用政府手段就是盖楼,搞基础建设,拉投资搞企业,搞旅游,搞
阅读全文
摘要:近日看到这么一个帖子: https://www.zhihu.com/question/612568623/answer/3131709693 类似的问题之前就写过,不该今天看到这个问题就又想再写一下,毕竟前段时间某东北沿海城市要建区级的计算中心以提供算力给周边诸个大学科研使用,而自己的师弟刚好入职就
阅读全文
摘要:近日看到这样一个帖子: https://www.zhihu.com/question/601227878 对此我的观点是,富人的努力总比穷人的努力抓人眼球。在世人眼中,穷人的努力就是为了解决温饱,为了生计,为了基本的生理需求,而富人的努力则是为了理想如何如何;在世人眼中,穷人的努力就是理所当然,即使
阅读全文
摘要:最近在看一个物联网的论文,论文的伪代码中有这么一个地方标有:ties broken arbitrarily,对这个写法有些搞不清楚含义,于是网上找到了下面的资料: https://www.zhihu.com/question/480782518 该帖子中给出的Demo如下: 关键地方: 根据原帖子中
阅读全文
摘要:个人感觉这个民办高校就是在全年365天不间断的招聘,或许这才是比较差劲的一个地方。一般这个高校的招聘都是全网撒网,不论是BOSS直聘还是啥的招聘网站,都会有这个民办高校的招聘消息。这个民办高校不仅要考虑你的学历还要考虑你是否可以在这个地方长久的干下去,因此并不是说你的学历高、能力强就一定能入职的,这
阅读全文
摘要:研究生学籍异动系统和离校系统使用简介 一、研究生学籍异动系统 研究生学籍异动指研究生办理休学、复学、结业、退学等常见学籍变动的业务。 1、线上办理入口 网页版请登录校园门户,进入“办事中心”搜索“研究生学籍异动”;也可使用移动端i大工APP,添加“办事中心”服务,搜索“研究生学籍异动”。 2、线上办
阅读全文
摘要:参考: https://www.codenong.com/51913361/ 官方文档解释: --force-reinstall Reinstall all packages even if they are already up-to-date. -I, --ignore-installed Ig
阅读全文
摘要:一个记录: 神奇的发型——所有的aarch64架构的CPU平台下的深度学习框架均不原生支持CUDA 不论是mindspore、pytorch、TensorFlow框架只要是aarch64架构的CPU下的系统平台均是原生不支持CUDA版本的,如果你想要在aarch64架构下使用支持CUDA的深度学习框
阅读全文
摘要:在提交主机上修改.bashrc文件: 第一种: 使用运行主机上的cuda环境: # CUDAexport PATH=/usr/local/cuda-11.4/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64 第二种:(anacond
阅读全文
摘要:最近在使用超算平台时报错,不管是git、cmake、wget、curl中的哪个都报错,大致错误: /usr/bin/cmake3: relocation error: /usr/lib64/libcurl.so.4: symbol SSLv3_client_method version OPENSS
阅读全文
摘要:最近在国产超算平台上安装pytorch,但是怎么弄都会报错: raise AssertionError("Torch not compiled with CUDA enabled")AssertionError: Torch not compiled with CUDA enabled 不论是使用p
阅读全文
摘要:人还没走,手续还没办,网就给我停了,这就要清人了,这学校太“nice”了!!!
阅读全文
摘要:好消息,居然有经费了,账号可以接着用了,可以接着玩超算了。 在超算平台上安装pytorch: 执行: export REQUESTS_CA_BUNDLE= export CURL_CA_BUNDLE= conda install pytorch torchvision torchaudio pyto
阅读全文
摘要:地址链接: https://www.dlaicc.com/ 很不幸的是课题组没有经费了,这个超算账号已然被华为官方停掉了,想想自己囊中羞涩还是一切作罢,估计关于超算方面的东西也就快分享到这里了。 要了解超算平台CPU的亲和性设置就需要知道几个概念:socket、numa node、core、proc
阅读全文
摘要:超算是离我们平时生活比较远的一个事情,即使是对于一个计算机专业方向的学生来说,正好实验室得到了华为的超算平台的使用账号,于是就摸索了一下,不得不承认这个东西确实不是普通人能搞的明白的。 基本概念: 一个工作Job可以开多个副本,每个副本都是mpirun -N 所开出的,每个副本又被叫做任务task,
阅读全文
摘要:战争机械狗的主要任务分为:侦查、运输、射击三个方面,对于侦查和运输本文不作讨论,本文讨论的是射击方面。 Problems: 现有的机械狗可以使用无后坐力炮、轻机枪单发射击等,但是在实际战斗场合中我们往往需要使用重机枪和支持连发的轻机枪,因为只有这样才具备真实意义,但是现有的机械狗往往难以应对这种实际
阅读全文
摘要:使用华为的超算平台已经好长时间了,一直有个疑问,那就是这个超算平台是否支持异构计算,于是用命令试验了一下,具体命令: /opt/batch/cli/bin/dsub -n task_test -A xxxxxxxxxxxx -eo error.txt -oo output.txt -R "gpu=1
阅读全文
摘要:原文地址: https://language.chinadaily.com.cn/a/201808/07/WS5b69584aa3100d951b8c9199.html PS:平时这英语总是搞出Chinese English,总觉得不是很好,无意中网上看到了这个文章,感觉比较受用,于是收录在这以备日
阅读全文
摘要:最近在使用Redis的时候遇到了linux系统中的vm.overcommit_memory参数设置,对此不是很了解,于是研究了一下,有了本文。 一个尝试,如何在内存中申请空间: >>> 100000*400000*8/1024/1024/1024298.0232238769531 实际代码: imp
阅读全文