摘要: 在GPU计算或AI芯片的上下文中,“稀疏”(Sparsity)通常指的是利用计算模型或数据中的稀疏性(即大量零值或无关值)来优化性能和效率的一种技术。 什么是稀疏? 稀疏指的是数据或计算操作中存在大量零值或不重要的元素。在机器学习和深度神经网络(DNN)中,这种稀疏性可能出现在以下几个方面: 权重稀 阅读全文
posted @ 2025-03-20 11:39 文十七 阅读(182) 评论(0) 推荐(0)
摘要: ECC (Error Correction Code,错误校验与纠正)是一种内存技术,广泛应用于需要高数据可靠性的场景,如服务器、数据中心 GPU、工作站和关键任务计算。它通过在数据中添加冗余校验位,能够检测并纠正内存中的错误,从而提高系统的稳定性和数据的完整性。以下是对 ECC 的详细介绍,包括原 阅读全文
posted @ 2025-03-20 11:38 文十七 阅读(797) 评论(0) 推荐(0)
摘要: Chipkill 是一种高级内存错误纠正技术,属于 ECC(Error Correction Code,错误校验与纠正)的增强版本。它不仅能够纠正单个比特错误,还能处理整个内存芯片(DRAM 芯片)失效的情况,提供比传统 SECDED ECC 更高的容错能力。Chipkill 最初由 IBM 开发, 阅读全文
posted @ 2025-03-20 11:36 文十七 阅读(309) 评论(0) 推荐(0)
摘要: GPU 显存带宽是衡量 GPU 内存性能的关键指标,直接影响数据传输速度和计算效率。以下是对 GPU 显存带宽的类型(主要基于内存技术)及其对比的详细介绍。 显存带宽的基本概念 显存带宽表示 GPU 内存每秒能传输的数据量,单位通常是 GB/s (千兆字节每秒)。它由以下公式决定: 带宽 = 内存频 阅读全文
posted @ 2025-03-20 11:35 文十七 阅读(535) 评论(0) 推荐(0)
摘要: PCIe、SXM 和 NVLink 是 NVIDIA GPU 生态系统中三种密切相关但功能不同的技术或设计,它们共同定义了 GPU 的连接方式、通信性能和应用场景。 1. PCIe(Peripheral Component Interconnect Express) 定义 PCIe 是一种通用的串行 阅读全文
posted @ 2025-03-20 11:34 文十七 阅读(1962) 评论(0) 推荐(0)
摘要: 矩阵计算与 GPU 计算性能衡量 为什么矩阵计算可以衡量 GPU 计算性能 矩阵运算是线性代数中最基本的计算形式之一,广泛应用于科学计算、图形渲染、机器学习等领域。GPU(图形处理单元)专为大规模并行计算设计,具备处理大量矩阵操作的能力。因此,矩阵运算成为衡量 GPU 性能的有效手段。 矩阵乘法等操 阅读全文
posted @ 2025-03-20 10:07 文十七 阅读(217) 评论(0) 推荐(0)