摘要: 这是一个常见的误解或信息混淆。我们来澄清几个关键点: ❌ 错误前提澄清 “铜缆的物理传输速率极限是200Gbps,提出者:NVIDIA Megatron-LM(2019)” —— 这个说法不成立。 原因如下: 1. Megatron-LM(2019)是一篇关于大模型训练的论文,不研究物理层通信 Me 阅读全文
posted @ 2025-10-30 15:59 rebeca8 阅读(14) 评论(0) 推荐(0)
摘要: 源杰科技(股票代码:688498.SH)是中国光芯片领域的核心企业,近年来在AI算力爆发、数据中心升级和国产替代加速的背景下,实现了从“电信市场承压”到“数通业务爆发”的战略转型。以下从公司概况、技术实力、产品布局、财务表现、市场前景、风险因素、估值逻辑等维度进行系统性深度分析。 一、公司概况 全称 阅读全文
posted @ 2025-10-30 14:33 rebeca8 阅读(35) 评论(0) 推荐(0)
摘要: “专家并行”(Expert Parallelism, EP)是大模型训练中的一种模型并行策略,主要用于支持稀疏激活模型(如 Mixture of Experts, MoE)的高效训练。它与其他并行策略(如数据并行、张量并行、流水线并行等)共同构成了现代大模型分布式训练的基础设施。 下面我们将系统性地 阅读全文
posted @ 2025-10-30 12:19 rebeca8 阅读(8) 评论(0) 推荐(0)