marsggbo

2024年6月26日

摘要：原文: https://sumanthrh.com/post/distributed-and-efficient-finetuning/#zero-powered-data-parallelism 阅读全文

posted @ 2024-06-26 23:39 marsggbo 阅读(344) 评论(0) 推荐(0)

2024年6月9日

摘要： 1. 账号申请如果是 NUS，NTU 或者 ASTAR 的学生，可以直接用自己的学校 ID 登录。登录不上的话可以发邮件联系 nscc 工作人员即可，基本上第二天就会回复解决。 2. VSCode 连接账号申请下来后进官网设置你的 ssh key 之类的东西就可以登录了。第一次登录成功后，可以参阅读全文

posted @ 2024-06-09 21:19 marsggbo 阅读(474) 评论(0) 推荐(0)

2024年5月6日

Huggingface Transformers实现张量并行的小坑 set/get_output_embeddings

摘要： transformers 库里实现的很多模型会有这么两个函数 get_output_embeddings和 get_output_embeddings。以 SwitchTransformer 为例 class SwitchTransformersForConditionalGeneration(Sw 阅读全文

posted @ 2024-05-06 11:17 marsggbo 阅读(466) 评论(0) 推荐(0)

2024年4月21日

Pytorch 如何使用 storage 实现参数 offload？

摘要：在深入探讨 PyTorch 中的 Storage 类以及其在参数 offload 场景中的应用之前，让我们首先了解一下 PyTorch 和它的基础组件。PyTorch 是一个广泛使用的开源机器学习库，它不仅提供了强大的计算图功能和自动梯度计算，还允许开发者直接操作底层数据结构，这其中就包括 Stor 阅读全文

posted @ 2024-04-21 19:07 marsggbo 阅读(644) 评论(0) 推荐(0)

2024年4月10日

TACC 集群使用笔记

摘要： 1注册账号先在网页上注册账号，之后需要联系导师或者管理员把你添加到对应的集群里去，例如我加入的是 Lonestar6 集群。之后需要跟着这个教程绑定 MFA 软件（可以是 DUO 或者 1password）之后登录账号,系统会要求先后输入你的账户密码和 MFA 的 6 位数 token loc 阅读全文

posted @ 2024-04-10 14:26 marsggbo 阅读(205) 评论(0) 推荐(0)

2024年4月4日

图解 vLLM 的推理调度策略

摘要：原文：从continuous batching到vLLM中的batching - 不知叫什么好的文章 - 知乎 https://zhuanlan.zhihu.com/p/688551989 阅读全文

posted @ 2024-04-04 10:32 marsggbo 阅读(3167) 评论(0) 推荐(0)

2024年3月23日

大模型推理框架 vLLM 源码解析（二）：Block 模块分配和管理

摘要： 1. Block 概览 vLLM 的一个很大创新点是将物理层面的 GPU 和 CPU 可用内存切分成若干个 block,这样可以有效降低内存碎片化问题。具体而言，vLLM 的 block 分为逻辑层面（logical）和物理层面（physical），二者之间存在映射关系。下图很好解释了两个层面 bl 阅读全文

posted @ 2024-03-23 20:48 marsggbo 阅读(6888) 评论(0) 推荐(1)

2024年2月22日

OpenAI 的视频生成大模型Sora的核心技术详解（一）：Diffusion模型原理和代码详解

摘要：标题党一下，顺便蹭一下 OpenAI Sora大模型的热点，主要也是回顾一下扩散模型的原理。 1. 简单理解扩散模型简单理解，扩散模型如下图所示可以分成两部分，一个是 forward，另一个是 reverse 过程： forward：这是加噪声的过程，表示为\(q(X_{0:T})\)，即在原图（阅读全文

posted @ 2024-02-22 16:49 marsggbo 阅读(1269) 评论(0) 推荐(4)

2024年2月4日

大模型推理框架 vLLM 源码解析（一）

摘要： 1. Quick Start 创建如下代码，命名为 run.py from vllm import LLM, SamplingParams prompts = [ "Have you followed marsggbo in Zhihu?", "你一键三连了吗？" ] # 输入prompts sam 阅读全文

posted @ 2024-02-04 18:14 marsggbo 阅读(11332) 评论(1) 推荐(2)

2024年1月15日

vllm 安装踩坑 (The NVIDIA driver on your system is too old)

摘要：我的环境如下： nvidia-smi 显示 cuda 版本是 11.7 目前最新vllm 要求的 torch 版本是 2.1.2，该版本要求的 cuda 版本是 11.8，所以不匹配。执行安装会遇到如下错误 RuntimeError: The NVIDIA driver on your system 阅读全文

posted @ 2024-01-15 20:35 marsggbo 阅读(7090) 评论(9) 推荐(0)

互道晚安，王者峡谷见

公告