会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
marsggbo
互道晚安,王者峡谷见
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
···
46
下一页
2023年7月21日
FlashAttention算法简介
摘要: # 1. Motivation 不同硬件模块之间的带宽和存储空间有明显差异,例如下图中左边的三角图,最顶端的是GPU种的SRAM,它的容量非常小但是带宽非常大,以A100 GPU为例,它有108个流式多核处理器,每个处理器上的片上SRAM大小只有192KB,因此A100总共的SRAM大小是192KB
阅读全文
posted @ 2023-07-21 14:46 marsggbo
阅读(1838)
评论(0)
推荐(0)
2023年7月10日
【转】一文看懂 LLaMA 中的旋转式位置编码(Rotary Position Embedding)
摘要: 原文:https://mp.weixin.qq.com/s/0peSNWN0ypMopPR0Q_pujQ 
阅读全文
posted @ 2023-07-10 15:49 marsggbo
阅读(1259)
评论(0)
推荐(0)
2023年7月6日
Oh-my-zsh主题乱码解决办法
摘要: Oh-my-zsh主题乱码解决办法是安装 Powerline 字体。 打开终端,参考以下命令安装 Powerline 字体: ```bash cd ~/Downloads && git clone https://github.com/powerline/fonts.git #将 Powerline
阅读全文
posted @ 2023-07-06 11:28 marsggbo
阅读(5643)
评论(0)
推荐(0)
2023年6月24日
《Transformer Quality in Linear Time》论文解读
摘要: 会议/期刊: ICML 年份: 2022 # 1. Vanilla Transformer Block(MHSA+FFN) 原本的Transformer的Block遵循如下的设计范式:MHSA(多头自注意力)+ 一层或者两层的FFN(全连接层),如下图所示。我们只考虑FFN的话,其数学表达式如下:T
阅读全文
posted @ 2023-06-24 09:49 marsggbo
阅读(1040)
评论(0)
推荐(0)
2023年4月17日
腰椎间盘突出锻炼指南
摘要: 参考:https://www.haodf.com/neirong/wenzhang/5754189540.html?flowToken=4d900e3599a358a4061799f8fa8a0f18
阅读全文
posted @ 2023-04-17 08:08 marsggbo
阅读(85)
评论(0)
推荐(0)
2023年3月23日
Python多进程代码调试工具
摘要: https://github.com/Lightning-AI/forked-pdb import sys import pdb class ForkedPdb(pdb.Pdb): """ PDB Subclass for debugging multi-processed code Suggest
阅读全文
posted @ 2023-03-23 22:48 marsggbo
阅读(374)
评论(0)
推荐(0)
2023年3月22日
安装TensorNVMe和Deepspeed时遇到的坑:无root权限安装libaio依赖库
摘要: 如果你有root权限,用下面这行代码一键安装即可: sudo apt install libaio1 libaio-dev 如果没有root权限,步骤如下 下载 libaio git clone https://pagure.io/libaio 安装libaio cd libaio make pre
阅读全文
posted @ 2023-03-22 15:20 marsggbo
阅读(1364)
评论(0)
推荐(0)
2023年2月19日
如何远程SSH到Windows内部的虚拟机?
摘要: 1. 背景 我学校有一台Windows电脑 (x@a.b.c.d),里面安装了一个Ubuntu虚拟机(用户名为y),虚拟机里连着VPN。并且虚拟机的22端口映射到了主机的22端口。通过这个VPN我可以访问另一个远程的服务器(z@e.f.g.h)用于炼丹。 我现在在家,无法直接访问远程服务器,只能把学
阅读全文
posted @ 2023-02-19 00:38 marsggbo
阅读(748)
评论(0)
推荐(0)
2023年1月25日
Ubuntu ARM版本如何运行openconnect-sso?
摘要: 前言 操作系统:Ubuntu 22.04 ARM64 1. 安装openconnect-sso 先安装anaconda或者miniconda,然后运行如下命令 conda install -c conda-forge openconnect-sso 2. 解决openssl的bug 安装好后照理来说
阅读全文
posted @ 2023-01-25 12:58 marsggbo
阅读(194)
评论(0)
推荐(0)
2022年11月9日
深度学习并行训练算法一锅炖: DDP, TP, PP, ZeRO
摘要: 本文主要参考ColossalAI论文 Colossal-AI: A Unified Deep Learning System For Large-Scale Parallel Training ColossalAI框架开源提供了本文介绍的所有并行训练: https://github.com/hpca
阅读全文
posted @ 2022-11-09 00:16 marsggbo
阅读(11940)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
···
46
下一页
公告