会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
marsggbo
互道晚安,王者峡谷见
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
···
47
下一页
2023年2月19日
如何远程SSH到Windows内部的虚拟机?
摘要: 1. 背景 我学校有一台Windows电脑 (x@a.b.c.d),里面安装了一个Ubuntu虚拟机(用户名为y),虚拟机里连着VPN。并且虚拟机的22端口映射到了主机的22端口。通过这个VPN我可以访问另一个远程的服务器(z@e.f.g.h)用于炼丹。 我现在在家,无法直接访问远程服务器,只能把学
阅读全文
posted @ 2023-02-19 00:38 marsggbo
阅读(777)
评论(0)
推荐(0)
2023年1月25日
Ubuntu ARM版本如何运行openconnect-sso?
摘要: 前言 操作系统:Ubuntu 22.04 ARM64 1. 安装openconnect-sso 先安装anaconda或者miniconda,然后运行如下命令 conda install -c conda-forge openconnect-sso 2. 解决openssl的bug 安装好后照理来说
阅读全文
posted @ 2023-01-25 12:58 marsggbo
阅读(205)
评论(0)
推荐(0)
2022年11月9日
深度学习并行训练算法一锅炖: DDP, TP, PP, ZeRO
摘要: 本文主要参考ColossalAI论文 Colossal-AI: A Unified Deep Learning System For Large-Scale Parallel Training ColossalAI框架开源提供了本文介绍的所有并行训练: https://github.com/hpca
阅读全文
posted @ 2022-11-09 00:16 marsggbo
阅读(12110)
评论(0)
推荐(0)
2022年10月27日
NCCL, PCIe, NVLink, Infiniband, RDMA都是些啥?
摘要: 原文: https://blog.csdn.net/qq_43219379/article/details/123436895
阅读全文
posted @ 2022-10-27 16:48 marsggbo
阅读(3733)
评论(0)
推荐(0)
2022年10月3日
Latex编码错误:inputenc Error: Unicode char ́ (U+0301)
摘要: 遇到这个报错信息,大概率是因为你的bib文件或者tex正文里出现了这个长得像e的字符:é 解决办法很简单,你只需要在tex最前面(就是\usepackage那一坨地方)加上这么一行声明就好了 \DeclareUnicodeCharacter{0301}{\'{e}} 它的作用就是把 Unicode
阅读全文
posted @ 2022-10-03 17:55 marsggbo
阅读(1935)
评论(0)
推荐(0)
2022年9月29日
Latex表格太宽怎么办?用 sidewaystable !
摘要: \begin{sidewaystable}[!tbp] \caption{Example of SideWaysTable} \centering \begin{tabular}{c|c|c|c|c|c|c|c|c|c|c|c|c} \hline AAAAA & BBBB & CCCC & DDDD
阅读全文
posted @ 2022-09-29 19:49 marsggbo
阅读(375)
评论(0)
推荐(0)
Latex表格太长,一页放不下怎么办?用 longtable
摘要: \usepackage{longtable} \begin{longtable}{l|c|c} % \centering \caption[Short Caption]{Full Caption Content.} \label{table:longtable_example} \\ % 下面是表头
阅读全文
posted @ 2022-09-29 17:05 marsggbo
阅读(2867)
评论(0)
推荐(0)
Latex 如何写算法?推荐模板
摘要: 之前我已经在这篇文章总结了现有的算法包的区别。如果有选择苦难症的朋友可以考虑无脑使用以下模板来写算法。 \usepackage[noend]{algpseudocode} # noend表示算法不显示 EndIf或者EndFor这些,可以用来节省空间 \usepackage{algorithmicx
阅读全文
posted @ 2022-09-29 16:54 marsggbo
阅读(1021)
评论(0)
推荐(0)
2022年8月6日
RuntimeError: NCCL error in:/torch/csrc/distributed/c10d/ProcessGroupNCCL.cpp:1248, unhandled system error, NCCL version 2.12.10
摘要: 在NGC集群使用https://github.com/pytorch/examples/blob/main/imagenet/main.py跑ImageNet分布式训练,运行命令是 python main.py --dist-url 'tcp://127.0.0.1:8888' --dist-bac
阅读全文
posted @ 2022-08-06 13:51 marsggbo
阅读(8704)
评论(0)
推荐(0)
2022年7月28日
Slurm集群下如何远程连接Jupyter并使用GPU资源?
摘要: 背景 Slurm集群一般是由一个主节点(master)和各个带有GPU资源的子节点组成的,每次要想使用GPU需要通过主节点跳转到子节点。那么如果我们想使用jupyter使用子节点的GPU应该怎么做呢? 我有试过连接子节点后直接运行jupyter命令,然后再本地电脑上打开127.0.0.1:8888/
阅读全文
posted @ 2022-07-28 12:10 marsggbo
阅读(1037)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
···
47
下一页
公告