摘要:
原始链接:https://www.cnblogs.com/yfceshi/p/18992502 2025年6月5日凌晨,阿里云多个服务突发异常,罪魁祸首居然是它自家的“核心域名”——aliyuncs.com。包括对象存储OSS、内容分发 CDN、镜像仓库 ACR、云解析 DNS 等服务在内,全部受到
阅读全文
posted @ 2025-10-31 16:02
rebeca8
阅读(21)
推荐(0)
摘要:
这是一个常见的误解或信息混淆。我们来澄清几个关键点: ❌ 错误前提澄清 “铜缆的物理传输速率极限是200Gbps,提出者:NVIDIA Megatron-LM(2019)” —— 这个说法不成立。 原因如下: 1. Megatron-LM(2019)是一篇关于大模型训练的论文,不研究物理层通信 Me
阅读全文
posted @ 2025-10-30 15:59
rebeca8
阅读(15)
推荐(0)
摘要:
源杰科技(股票代码:688498.SH)是中国光芯片领域的核心企业,近年来在AI算力爆发、数据中心升级和国产替代加速的背景下,实现了从“电信市场承压”到“数通业务爆发”的战略转型。以下从公司概况、技术实力、产品布局、财务表现、市场前景、风险因素、估值逻辑等维度进行系统性深度分析。 一、公司概况 全称
阅读全文
posted @ 2025-10-30 14:33
rebeca8
阅读(41)
推荐(0)
摘要:
“专家并行”(Expert Parallelism, EP)是大模型训练中的一种模型并行策略,主要用于支持稀疏激活模型(如 Mixture of Experts, MoE)的高效训练。它与其他并行策略(如数据并行、张量并行、流水线并行等)共同构成了现代大模型分布式训练的基础设施。 下面我们将系统性地
阅读全文
posted @ 2025-10-30 12:19
rebeca8
阅读(12)
推荐(0)
摘要:
NVLink 和 NVSwitch 是英伟达(NVIDIA)为解决高性能计算和人工智能(AI)场景下多 GPU 间通信瓶颈而设计的两项核心技术。它们虽然紧密相关,但角色和功能有本质区别。下面从基础概念、功能定位、技术演进、工作原理和实际应用等方面进行详细分析。 一、基础概念区分 项目NVLinkNV
阅读全文
posted @ 2025-10-29 10:57
rebeca8
阅读(31)
推荐(0)
摘要:
目前,分散在各地的GPU智算集群之间通常没有直接的、实时的相互调用关系来共同训练一个单一的大模型。它们之间的关系更多是独立运作、资源错配或通过更高层级的调度系统进行间接协调,而不是像单个集群内部的GPU那样紧密协同。 这背后的原因和现状可以从以下几个层面来理解: 1. 技术瓶颈:通信延迟是“不可逾越
阅读全文
posted @ 2025-10-27 19:53
rebeca8
阅读(10)
推荐(0)
摘要:
virtual output queuing机制,是一种被广泛使用的内部调度机制,为了解决队头阻塞问题(head of line Blocking,hol blocking) 虚拟输出队列(Virtual Output Queuing, VOQ)是一种在高速交换机和路由器中广泛采用的内部调度机制,旨
阅读全文
posted @ 2025-10-27 18:04
rebeca8
阅读(13)
推荐(0)
摘要:
阿里云的ACCL(Alibaba Cloud Collective Communication Library)是一个高性能的集合通信库,主要用于大规模分布式深度学习训练场景中的GPU间通信。它并非从零构建,而是在NVIDIA NCCL(NVIDIA Collective Communication
阅读全文
posted @ 2025-10-21 17:27
rebeca8
阅读(25)
推荐(0)
摘要:
腾讯的 TCCL(Tencent Collective Communication Library)和阿里云的 ACCL(Alibaba Collective Communication Library)都是各自云厂商为应对大规模 AI 模型训练场景,基于或参考 NVIDIA NCCL 构建的高性能
阅读全文
posted @ 2025-10-21 17:26
rebeca8
阅读(27)
推荐(0)
摘要:
PMTU 机制原理 PMTU(Path Maximum Transmission Unit,路径最大传输单元)发现机制 是一种用于动态探测从源主机到目的主机之间整条网络路径上最小 MTU 值的技术,目的是避免 IP 数据包在传输过程中被分片。 ✅ 核心目标 确保发送的数据包大小不超过路径中任何一跳链
阅读全文
posted @ 2025-10-15 10:45
rebeca8
阅读(33)
推荐(0)
摘要:
ECN(显式拥塞通知)机制通过在 IP 头部 和 TCP 头部 中使用特定的比特位(bit)来实现拥塞的标记与反馈。这些比特位协同工作,完成从网络设备标记拥塞,到接收方通知发送方,再到发送方响应的完整流程。 下面我们详细解释这些比特位在 IP 头和 TCP 头中的位置及其工作方式。 一、IP 头部中
阅读全文
posted @ 2025-10-13 11:48
rebeca8
阅读(41)
推荐(0)
摘要:
您在社交媒体上看到的那些“3D打印手办”照片,绝大多数并非真实3D打印的产物,而是由谷歌的AI模型Nano-banana(即Gemini 2.5 Flash Image)直接生成的虚拟图片。目前的3D打印技术完全可以制作出类似效果的实体手办,但整个过程比AI“一键生成”要复杂得多,无法实现AI那样的
阅读全文
posted @ 2025-09-24 10:35
rebeca8
阅读(140)
推荐(0)
摘要:
Envoy 和 Nginx 都是高性能的网络代理和反向代理服务器,广泛应用于现代分布式系统中。尽管它们在某些场景下功能重叠(如负载均衡、反向代理),但在设计目标、架构、功能特性和适用场景上存在显著差异。 以下是 Envoy 和 Nginx 的主要区别: 1. 设计目标与定位 Nginx: 起源于 2
阅读全文
posted @ 2025-09-23 11:47
rebeca8
阅读(45)
推荐(0)
摘要:
GA的核心原理:不是单纯靠Anycast,而是“Anycast + 智能DNS + 四层代理转发”三位一体 虽然常说“GA使用Anycast”,但更准确地说: ✅ GA的本质是:通过智能DNS将用户导向最近的Anycast接入点,再经由阿里云高质量骨干网转发至后端源站,实现四层透明加速。 下面我们分
阅读全文
posted @ 2025-09-22 21:05
rebeca8
阅读(39)
推荐(0)
摘要:
https://www.bilibili.com/video/BV1do3LzUE6q/?vd_source=d2f44d877d30deb74ddb6355d24b3a8b https://www.rethink.fun/
阅读全文
posted @ 2025-09-15 16:25
rebeca8
阅读(18)
推荐(0)
摘要:
from 智能计算芯世界 1. 基础架构:工艺、封装与功耗控制 GB10 采用台积电 3nm 工艺制造,通过 2.5D 中介层完成封装,最直接的优势是功耗控制:整体功耗稳定在 140 瓦,可直接接入标准壁式电源,无需依赖服务器机柜的复杂配电系统。这一设计对中小型研究团队、独立开发者及实验室场景极具实
阅读全文
posted @ 2025-09-10 16:13
rebeca8
阅读(129)
推荐(0)
摘要:
在光网络(Optical Network)中,OCP、OMSP 和 OLP 是三种常见的光层保护机制,用于提高网络的可靠性和容错能力。它们分别代表不同的保护方案,适用于不同层次和场景。以下是它们的具体含义和区别: 1. OCP:Optical Channel Protection(光通道保护) 中文
阅读全文
posted @ 2025-09-09 14:29
rebeca8
阅读(135)
推荐(0)
摘要:
RWA(现实世界资产)和稳定币是区块链与去中心化金融(DeFi)生态系统中两个紧密关联、相辅相成的核心组成部分。它们之间的关系可以概括为: 稳定币是RWA交易的“链上货币”,RWA是稳定币价值的“链下资产支撑”。 它们共同构建了一个“资产上链 → 稳定币结算 → 全球流通”的闭环金融生态。 一、稳定
阅读全文
posted @ 2025-09-03 11:45
rebeca8
阅读(195)
推荐(0)
摘要:
OCS交换机是光电路交换机,CPO是共封装交换机。 本质上来说,OCS是一种网络架构创新,强调通过光通路实现高效,低延迟的长连接传输。COP是一种硬件封装创新,通过缩短电光接口距离,提升带宽密度和能效率。 OCS(Optical Circuit Switching,光电路交换)交换机和CPO(Co-
阅读全文
posted @ 2025-09-01 15:49
rebeca8
阅读(407)
推荐(0)
摘要:
英伟达 Spectrum-XGS 破局:Scale-Across 引航 AI 超级工厂,三大细分赛道迎增量 原文:https://mp.weixin.qq.com/s/XDAPYZOygv4QWc-Ng5GD4A 文章核心总结 这篇文章发布于2025年8月25日,核心内容是:英伟达(NVIDIA)推
阅读全文
posted @ 2025-08-26 23:55
rebeca8
阅读(297)
推荐(0)
摘要:
DeepSeek 作为近年来中国人工智能领域的重要突破,其最大的不同和带来的启示主要体现在技术路径、开放理念、成本控制以及对创新生态的深远影响上。我们可以从以下几个方面来理解: 一、DeepSeek 最大的不同是什么? 开源开放 vs 闭源垄断 DeepSeek 选择完全开源:其模型代码、训练方法和
阅读全文
posted @ 2025-08-18 11:40
rebeca8
阅读(58)
推荐(0)
摘要:
这是一个非常深刻且引人入胜的问题。音乐和图片(或视觉影像)的结合之所以具有如此强大的感染力,是因为它们共同作用于我们大脑中处理情感、记忆和感知的核心区域,触发了多层次的心理和生理反应。以下从几个关键角度来解释这种强大力量的来源: 1. 多感官协同,增强情感共鸣 音乐直接作用于情绪系统:旋律、节奏、和
阅读全文
posted @ 2025-08-12 11:04
rebeca8
阅读(28)
推荐(0)
摘要:
libbpf 是一个用于在用户空间与 Linux 内核的 eBPF(extended Berkeley Packet Filter)子系统进行交互的 C 语言库。它由内核社区维护(主要在 tools/lib/bpf/ 目录下),是编写和部署 eBPF 程序的标准方式之一。 核心功能: 加载 eBPF
阅读全文
posted @ 2025-07-30 17:26
rebeca8
阅读(123)
推荐(0)
摘要:
中日甲午战争期间,主要的海战包括丰岛海战和黄海海战。以下是这两个战役的详细总结说明: 丰岛海战 时间: 1894年7月25日 地点: 朝鲜半岛西海岸丰岛附近海域 参战双方及军舰型号: 日本联合舰队第一游击队 吉野号(英国制造,排水量4,200吨,航速23节) 浪速号(英国制造,排水量3,700吨,航
阅读全文
posted @ 2025-07-29 11:44
rebeca8
阅读(101)
推荐(0)
摘要:
如果你的realtek网卡通过自协商只能跑100Mbps,ethtool ethx可以查看网卡当前的协商的网速: 那么可以尝试一下以下的命令: ethtool -s eth0 speed 1000 duplex full autoneg on 重新设置之后,药到命除。 参考文档: 1)https:/
阅读全文
posted @ 2025-07-27 19:13
rebeca8
阅读(51)
推荐(0)
摘要:
惊爆!72.1K star 的 Netdata:实时监控与可视化的超炫神器! 在当今复杂的 IT 环境中,实时监控与可视化对于保障系统的稳定运行和性能优化至关重要。 无论是服务器、应用程序,还是网络设备,及时获取性能数据能够帮助我们快速定位问题、优化资源配置。 Netdata,作为一个开源的实时监控
阅读全文
posted @ 2025-06-18 09:40
rebeca8
阅读(260)
推荐(0)
摘要:
wrk -t 3 -c 10 -d 20 http://xx.xx.xx.xx:443 ping xx.xx.xx.xxtelnet xx.xx.xx.xx 443yum install hping3hping3 -c 3 -S -p 443 xx.xx.xx.xxhping3 -c 10 -S -
阅读全文
posted @ 2025-06-17 12:08
rebeca8
阅读(11)
推荐(0)
摘要:
Aeron 框架初探 Aeron 是什么 Aeron 是一款开源的高性能消息传递框架,专为低延迟和高吞吐场景设计。它被广泛应用于金融、游戏、分布式系统等需要快速通信的领域。Aeron 的核心优势在于通过零拷贝技术和直接内存访问,最大限度地降低消息传递的延迟,同时利用高效的网络协议实现数据的可靠传输。
阅读全文
posted @ 2025-06-11 11:11
rebeca8
阅读(99)
推荐(0)
posted @ 2025-06-01 23:42
rebeca8
阅读(17)
推荐(0)
摘要:
方言大模型项目计划书 一、项目概述 本项目旨在创建一个专注于吴语方言的大型语言模型,能够理解和生成吴语方言文本。该模型将应用于方言保护、文化传承和本地化服务等领域。 二、项目目标 构建高质量的吴语方言数据集 训练和优化吴语方言专用的语言模型 开发API接口和演示应用 实现方言识别、文本生成等基础功能
阅读全文
posted @ 2025-05-27 12:19
rebeca8
阅读(63)
推荐(0)
摘要:
在使用Selenium的WebDriver与Firefox浏览器进行自动化操作时,find_element方法用于定位页面上的元素。Selenium提供了多种定位策略,包括通过ID、名称、类名、标签名、链接文本、部分链接文本、XPath和CSS选择器等。下面是一些具体的案例,展示了如何使用这些定位策
阅读全文
posted @ 2025-05-26 14:46
rebeca8
阅读(75)
推荐(0)
摘要:
理解分布式一致性:Raft协议 理解分布式一致性:Raft协议 什么是分布式一致性 Leader选举 日志复制流程 term选举周期 timeout 选举和选举timeout 选举分裂 日志复制和心跳timeout 在分布式系统中,分布式一致性是一个非常重要的概念,它是指分布式系统的各个服务器都保持
阅读全文
posted @ 2025-05-22 14:51
rebeca8
阅读(35)
推荐(0)
摘要:
Mac使用Colima运行Docker 原文链接:https://piaohua.github.io/post/docker/20231028-mac-colima/ 2023-10-28 docker 2028 words 5 mins read Contents Installation 启动
阅读全文
posted @ 2025-04-24 22:12
rebeca8
阅读(553)
推荐(0)
摘要:
原文链接:https://zhuanlan.zhihu.com/p/22886116297 自从卸载Docker Desktop后,我一直在使用Colima。过去这三年中,它一直稳定可靠。但随着时间推移,我也逐渐发现了一些问题:Colima依然依赖Docker作为容器引擎,而且它基于第三方的Lima
阅读全文
posted @ 2025-04-24 22:08
rebeca8
阅读(520)
推荐(0)
摘要:
Colima代替Docker Desktop(更换镜像源) Colima 在 Mac 上创建一个虚拟机并在其中安装 Docker Runtime(默认),Mac 上通过 docker cli 进行访问和普通使用 docker cli 无差别 特点 Intel and M1 Macs support
阅读全文
posted @ 2025-04-24 22:04
rebeca8
阅读(340)
推荐(0)
摘要:
Docker Vs Podman 翻译自 Chetansingh 2020年4月24日的博文《Docker Vs Podman》 [1] 容器化的一场全新革命是从 Docker 开始的,Docker 的守护进程管理着所有的事情,并成为最受欢迎和广泛使用的容器管理系统之一。 但是,请稍等!您真的会假设
阅读全文
posted @ 2025-04-24 22:03
rebeca8
阅读(74)
推荐(0)
摘要:
转自:http://live.xiaohongshu.com.sdwan.ltd/index.php?m=home&c=View&a=index&aid=132 香港作为全球重要数据传输驿站之一,其网络传输能力自然不可小瞧。根据香港政府通讯事务管理局办公室给出的资料,截至2019年1月,香港有十一个
阅读全文
posted @ 2025-02-10 20:26
rebeca8
阅读(166)
推荐(0)
摘要:
转载自:https://qiaodahai.com/the-international-cable-systems-in-china.html 中国联通海陆缆现状 中国联通在中国运营商中拥有最丰富的国际网络资源,23条海缆系统中容量过1500G;陆缆连接相邻国家和地区,带宽接近2000G。 中国联通
阅读全文
posted @ 2025-02-10 20:11
rebeca8
阅读(214)
推荐(0)
摘要:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" 如上方法,然后中间会要求输入管理员密码,然后就是将brew加到PATH需要敲几个交互命令
阅读全文
posted @ 2025-02-05 14:51
rebeca8
阅读(63)
推荐(0)
摘要:
Ollama是一个功能强大的本地大语言模型的运行框架,用户可以非常简单地运行使用各种LLM。最最主要的是它完全免费,本地可以离线运行; 1. 最简单的安装: curl https://ollama.ai/install.sh | sh 2.也可以访问ollam.com直接点击下载安装 3. 安装完成
阅读全文
posted @ 2025-02-05 14:22
rebeca8
阅读(3940)
推荐(0)