上一页 1 2 3 4 5 6 ··· 9 下一页
摘要: reference (现代处理器设计 - 超标量处理器基础)[https://github.com/chaos198800/xian-dai-chu-li-qi-she-ji chao-biao-liang-chu-li-qi-ji-chu-PDF?tab=readme-ov-file] 阅读全文
posted @ 2025-01-04 15:10 松—松 阅读(46) 评论(0) 推荐(0)
摘要: 1. 前言 大模型训练离不开集合通信 大模型分布式训练往往需要上千乃至上万 GPU 卡进行超大规模并行训练,是典型的计算密集型和通信密集型场景。 在真实的场景中,为了高效的训练,我们一般采用多种并行策略混合的方式。常见的包括数据并行,流水并行,张量并行,序列并行,专家并行,其中张量并行和流水线并行都 阅读全文
posted @ 2024-12-29 14:05 松—松 阅读(668) 评论(0) 推荐(0)
摘要: 1. ROCm简介 图 1:ROCm 软件栈的组成部分 ROCm是一个开源堆栈,主要由开源软件(OSS)组成,设计用于图形处理单元(GPU)计算。 ROCm由一组驱动程序、开发工具和api组成,支持从低级内核到最终用户应用程序的GPU编程。使用ROCm,您可以自定义GPU软件以满足您的特定需求。您可 阅读全文
posted @ 2024-12-21 16:21 松—松 阅读(1417) 评论(0) 推荐(0)
摘要: 本教程介绍 Linux 命令行 Bash 的基本用法和脚本编程。 referennce [Bash 脚本教程]https://www.bookstack.cn/read/bash-tutorial/README.md) shell 脚本案例 Bash 脚本教程中文 阅读全文
posted @ 2024-12-09 17:33 松—松 阅读(19) 评论(0) 推荐(0)
摘要: # 阅读全文
posted @ 2024-11-28 18:03 松—松 阅读(33) 评论(0) 推荐(0)
摘要: # 阅读全文
posted @ 2024-11-28 18:01 松—松 阅读(6) 评论(0) 推荐(0)
摘要: socket 概述 在一个典型的 C\S 场景中,应用程序使用 socket 进行通信的方式如下: 各个应用程序创建一个 socket。socket 是一个允许通信的“设备”,两个应用程序都需要用到它 服务器将自己的 socket 绑定到一个众所周知的地址上使得客户端能够定位到它的位置 通信 dom 阅读全文
posted @ 2024-11-28 18:00 松—松 阅读(44) 评论(0) 推荐(0)
摘要: 练习1.1 查阅你使用的编译器的文档,确定它所使用的文件名约定。编译并运行第2页的main程序。 解: g++ --std=c++11 ch1.cpp -o main ./main 练习1.2 改写程序,让它返回-1。返回值-1通常被当做程序错误的标识。重新编译并运行你的程序,观察你的系统如何处理m 阅读全文
posted @ 2024-11-17 17:28 松—松 阅读(23) 评论(0) 推荐(0)
摘要: 简介 《C++ Primer 中文版(第 5 版)》学习仓库,包括笔记和课后练习答案。 环境 System:Ubuntu 16.04 IDE:VS Code Compiler:g++ 熟悉编译器 g++: 编译:g++ --std=c++11 ch01.cpp -o main 运行:./prog1 阅读全文
posted @ 2024-11-17 10:39 松—松 阅读(35) 评论(0) 推荐(0)
摘要: Object Simobject 类是一个非常复杂但又十分重要的类。它在 Gem5 中占有及其重要的地位。gem5 的模块化设计是围绕 SimObject 类型构建的。模拟系统中的大多数组件都是 SimObjects 的子类,如 CPUs, caches, memory, memory contro 阅读全文
posted @ 2024-11-09 17:45 松—松 阅读(98) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 9 下一页