摘要: 原始链接:https://www.cnblogs.com/yfceshi/p/18992502 2025年6月5日凌晨,阿里云多个服务突发异常,罪魁祸首居然是它自家的“核心域名”——aliyuncs.com。包括对象存储OSS、内容分发 CDN、镜像仓库 ACR、云解析 DNS 等服务在内,全部受到 阅读全文
posted @ 2025-10-31 16:02 rebeca8 阅读(21) 评论(0) 推荐(0)
摘要: 这是一个常见的误解或信息混淆。我们来澄清几个关键点: ❌ 错误前提澄清 “铜缆的物理传输速率极限是200Gbps,提出者:NVIDIA Megatron-LM(2019)” —— 这个说法不成立。 原因如下: 1. Megatron-LM(2019)是一篇关于大模型训练的论文,不研究物理层通信 Me 阅读全文
posted @ 2025-10-30 15:59 rebeca8 阅读(15) 评论(0) 推荐(0)
摘要: 源杰科技(股票代码:688498.SH)是中国光芯片领域的核心企业,近年来在AI算力爆发、数据中心升级和国产替代加速的背景下,实现了从“电信市场承压”到“数通业务爆发”的战略转型。以下从公司概况、技术实力、产品布局、财务表现、市场前景、风险因素、估值逻辑等维度进行系统性深度分析。 一、公司概况 全称 阅读全文
posted @ 2025-10-30 14:33 rebeca8 阅读(41) 评论(0) 推荐(0)
摘要: “专家并行”(Expert Parallelism, EP)是大模型训练中的一种模型并行策略,主要用于支持稀疏激活模型(如 Mixture of Experts, MoE)的高效训练。它与其他并行策略(如数据并行、张量并行、流水线并行等)共同构成了现代大模型分布式训练的基础设施。 下面我们将系统性地 阅读全文
posted @ 2025-10-30 12:19 rebeca8 阅读(12) 评论(0) 推荐(0)
摘要: NVLink 和 NVSwitch 是英伟达(NVIDIA)为解决高性能计算和人工智能(AI)场景下多 GPU 间通信瓶颈而设计的两项核心技术。它们虽然紧密相关,但角色和功能有本质区别。下面从基础概念、功能定位、技术演进、工作原理和实际应用等方面进行详细分析。 一、基础概念区分 项目NVLinkNV 阅读全文
posted @ 2025-10-29 10:57 rebeca8 阅读(31) 评论(0) 推荐(0)
摘要: 目前,分散在各地的GPU智算集群之间通常没有直接的、实时的相互调用关系来共同训练一个单一的大模型。它们之间的关系更多是独立运作、资源错配或通过更高层级的调度系统进行间接协调,而不是像单个集群内部的GPU那样紧密协同。 这背后的原因和现状可以从以下几个层面来理解: 1. 技术瓶颈:通信延迟是“不可逾越 阅读全文
posted @ 2025-10-27 19:53 rebeca8 阅读(10) 评论(0) 推荐(0)
摘要: virtual output queuing机制,是一种被广泛使用的内部调度机制,为了解决队头阻塞问题(head of line Blocking,hol blocking) 虚拟输出队列(Virtual Output Queuing, VOQ)是一种在高速交换机和路由器中广泛采用的内部调度机制,旨 阅读全文
posted @ 2025-10-27 18:04 rebeca8 阅读(13) 评论(0) 推荐(0)
摘要: 阿里云的ACCL(Alibaba Cloud Collective Communication Library)是一个高性能的集合通信库,主要用于大规模分布式深度学习训练场景中的GPU间通信。它并非从零构建,而是在NVIDIA NCCL(NVIDIA Collective Communication 阅读全文
posted @ 2025-10-21 17:27 rebeca8 阅读(25) 评论(0) 推荐(0)
摘要: 腾讯的 TCCL(Tencent Collective Communication Library)和阿里云的 ACCL(Alibaba Collective Communication Library)都是各自云厂商为应对大规模 AI 模型训练场景,基于或参考 NVIDIA NCCL 构建的高性能 阅读全文
posted @ 2025-10-21 17:26 rebeca8 阅读(27) 评论(0) 推荐(0)
摘要: PMTU 机制原理 PMTU(Path Maximum Transmission Unit,路径最大传输单元)发现机制 是一种用于动态探测从源主机到目的主机之间整条网络路径上最小 MTU 值的技术,目的是避免 IP 数据包在传输过程中被分片。 ✅ 核心目标 确保发送的数据包大小不超过路径中任何一跳链 阅读全文
posted @ 2025-10-15 10:45 rebeca8 阅读(33) 评论(0) 推荐(0)
摘要: ECN(显式拥塞通知)机制通过在 IP 头部 和 TCP 头部 中使用特定的比特位(bit)来实现拥塞的标记与反馈。这些比特位协同工作,完成从网络设备标记拥塞,到接收方通知发送方,再到发送方响应的完整流程。 下面我们详细解释这些比特位在 IP 头和 TCP 头中的位置及其工作方式。 一、IP 头部中 阅读全文
posted @ 2025-10-13 11:48 rebeca8 阅读(41) 评论(0) 推荐(0)
摘要: 您在社交媒体上看到的那些“3D打印手办”照片,绝大多数并非真实3D打印的产物,而是由谷歌的AI模型Nano-banana(即Gemini 2.5 Flash Image)直接生成的虚拟图片。目前的3D打印技术完全可以制作出类似效果的实体手办,但整个过程比AI“一键生成”要复杂得多,无法实现AI那样的 阅读全文
posted @ 2025-09-24 10:35 rebeca8 阅读(140) 评论(0) 推荐(0)
摘要: Envoy 和 Nginx 都是高性能的网络代理和反向代理服务器,广泛应用于现代分布式系统中。尽管它们在某些场景下功能重叠(如负载均衡、反向代理),但在设计目标、架构、功能特性和适用场景上存在显著差异。 以下是 Envoy 和 Nginx 的主要区别: 1. 设计目标与定位 Nginx: 起源于 2 阅读全文
posted @ 2025-09-23 11:47 rebeca8 阅读(45) 评论(0) 推荐(0)
摘要: GA的核心原理:不是单纯靠Anycast,而是“Anycast + 智能DNS + 四层代理转发”三位一体 虽然常说“GA使用Anycast”,但更准确地说: ✅ GA的本质是:通过智能DNS将用户导向最近的Anycast接入点,再经由阿里云高质量骨干网转发至后端源站,实现四层透明加速。 下面我们分 阅读全文
posted @ 2025-09-22 21:05 rebeca8 阅读(39) 评论(0) 推荐(0)
摘要: https://www.bilibili.com/video/BV1do3LzUE6q/?vd_source=d2f44d877d30deb74ddb6355d24b3a8b https://www.rethink.fun/ 阅读全文
posted @ 2025-09-15 16:25 rebeca8 阅读(18) 评论(6) 推荐(0)
摘要: from 智能计算芯世界 1. 基础架构:工艺、封装与功耗控制 GB10 采用台积电 3nm 工艺制造,通过 2.5D 中介层完成封装,最直接的优势是功耗控制:整体功耗稳定在 140 瓦,可直接接入标准壁式电源,无需依赖服务器机柜的复杂配电系统。这一设计对中小型研究团队、独立开发者及实验室场景极具实 阅读全文
posted @ 2025-09-10 16:13 rebeca8 阅读(129) 评论(0) 推荐(0)
摘要: 在光网络(Optical Network)中,OCP、OMSP 和 OLP 是三种常见的光层保护机制,用于提高网络的可靠性和容错能力。它们分别代表不同的保护方案,适用于不同层次和场景。以下是它们的具体含义和区别: 1. OCP:Optical Channel Protection(光通道保护) 中文 阅读全文
posted @ 2025-09-09 14:29 rebeca8 阅读(135) 评论(0) 推荐(0)
摘要: RWA(现实世界资产)和稳定币是区块链与去中心化金融(DeFi)生态系统中两个紧密关联、相辅相成的核心组成部分。它们之间的关系可以概括为: 稳定币是RWA交易的“链上货币”,RWA是稳定币价值的“链下资产支撑”。 它们共同构建了一个“资产上链 → 稳定币结算 → 全球流通”的闭环金融生态。 一、稳定 阅读全文
posted @ 2025-09-03 11:45 rebeca8 阅读(195) 评论(0) 推荐(0)
摘要: OCS交换机是光电路交换机,CPO是共封装交换机。 本质上来说,OCS是一种网络架构创新,强调通过光通路实现高效,低延迟的长连接传输。COP是一种硬件封装创新,通过缩短电光接口距离,提升带宽密度和能效率。 OCS(Optical Circuit Switching,光电路交换)交换机和CPO(Co- 阅读全文
posted @ 2025-09-01 15:49 rebeca8 阅读(407) 评论(0) 推荐(0)
摘要: 英伟达 Spectrum-XGS 破局:Scale-Across 引航 AI 超级工厂,三大细分赛道迎增量 原文:https://mp.weixin.qq.com/s/XDAPYZOygv4QWc-Ng5GD4A 文章核心总结 这篇文章发布于2025年8月25日,核心内容是:英伟达(NVIDIA)推 阅读全文
posted @ 2025-08-26 23:55 rebeca8 阅读(297) 评论(0) 推荐(0)
摘要: DeepSeek 作为近年来中国人工智能领域的重要突破,其最大的不同和带来的启示主要体现在技术路径、开放理念、成本控制以及对创新生态的深远影响上。我们可以从以下几个方面来理解: 一、DeepSeek 最大的不同是什么? 开源开放 vs 闭源垄断 DeepSeek 选择完全开源:其模型代码、训练方法和 阅读全文
posted @ 2025-08-18 11:40 rebeca8 阅读(58) 评论(0) 推荐(0)
摘要: 这是一个非常深刻且引人入胜的问题。音乐和图片(或视觉影像)的结合之所以具有如此强大的感染力,是因为它们共同作用于我们大脑中处理情感、记忆和感知的核心区域,触发了多层次的心理和生理反应。以下从几个关键角度来解释这种强大力量的来源: 1. 多感官协同,增强情感共鸣 音乐直接作用于情绪系统:旋律、节奏、和 阅读全文
posted @ 2025-08-12 11:04 rebeca8 阅读(28) 评论(0) 推荐(0)
摘要: libbpf 是一个用于在用户空间与 Linux 内核的 eBPF(extended Berkeley Packet Filter)子系统进行交互的 C 语言库。它由内核社区维护(主要在 tools/lib/bpf/ 目录下),是编写和部署 eBPF 程序的标准方式之一。 核心功能: 加载 eBPF 阅读全文
posted @ 2025-07-30 17:26 rebeca8 阅读(123) 评论(0) 推荐(0)
摘要: 中日甲午战争期间,主要的海战包括丰岛海战和黄海海战。以下是这两个战役的详细总结说明: 丰岛海战 时间: 1894年7月25日 地点: 朝鲜半岛西海岸丰岛附近海域 参战双方及军舰型号: 日本联合舰队第一游击队 吉野号(英国制造,排水量4,200吨,航速23节) 浪速号(英国制造,排水量3,700吨,航 阅读全文
posted @ 2025-07-29 11:44 rebeca8 阅读(101) 评论(0) 推荐(0)
摘要: 如果你的realtek网卡通过自协商只能跑100Mbps,ethtool ethx可以查看网卡当前的协商的网速: 那么可以尝试一下以下的命令: ethtool -s eth0 speed 1000 duplex full autoneg on 重新设置之后,药到命除。 参考文档: 1)https:/ 阅读全文
posted @ 2025-07-27 19:13 rebeca8 阅读(51) 评论(0) 推荐(0)
摘要: 惊爆!72.1K star 的 Netdata:实时监控与可视化的超炫神器! 在当今复杂的 IT 环境中,实时监控与可视化对于保障系统的稳定运行和性能优化至关重要。 无论是服务器、应用程序,还是网络设备,及时获取性能数据能够帮助我们快速定位问题、优化资源配置。 Netdata,作为一个开源的实时监控 阅读全文
posted @ 2025-06-18 09:40 rebeca8 阅读(260) 评论(0) 推荐(0)
摘要: wrk -t 3 -c 10 -d 20 http://xx.xx.xx.xx:443 ping xx.xx.xx.xxtelnet xx.xx.xx.xx 443yum install hping3hping3 -c 3 -S -p 443 xx.xx.xx.xxhping3 -c 10 -S - 阅读全文
posted @ 2025-06-17 12:08 rebeca8 阅读(11) 评论(0) 推荐(0)
摘要: Aeron 框架初探 Aeron 是什么 Aeron 是一款开源的高性能消息传递框架,专为低延迟和高吞吐场景设计。它被广泛应用于金融、游戏、分布式系统等需要快速通信的领域。Aeron 的核心优势在于通过零拷贝技术和直接内存访问,最大限度地降低消息传递的延迟,同时利用高效的网络协议实现数据的可靠传输。 阅读全文
posted @ 2025-06-11 11:11 rebeca8 阅读(99) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2025-06-01 23:42 rebeca8 阅读(17) 评论(3) 推荐(0)
摘要: 方言大模型项目计划书 一、项目概述 本项目旨在创建一个专注于吴语方言的大型语言模型,能够理解和生成吴语方言文本。该模型将应用于方言保护、文化传承和本地化服务等领域。 二、项目目标 构建高质量的吴语方言数据集 训练和优化吴语方言专用的语言模型 开发API接口和演示应用 实现方言识别、文本生成等基础功能 阅读全文
posted @ 2025-05-27 12:19 rebeca8 阅读(63) 评论(0) 推荐(0)
摘要: 在使用Selenium的WebDriver与Firefox浏览器进行自动化操作时,find_element方法用于定位页面上的元素。Selenium提供了多种定位策略,包括通过ID、名称、类名、标签名、链接文本、部分链接文本、XPath和CSS选择器等。下面是一些具体的案例,展示了如何使用这些定位策 阅读全文
posted @ 2025-05-26 14:46 rebeca8 阅读(75) 评论(2) 推荐(0)
摘要: 理解分布式一致性:Raft协议 理解分布式一致性:Raft协议 什么是分布式一致性 Leader选举 日志复制流程 term选举周期 timeout 选举和选举timeout 选举分裂 日志复制和心跳timeout 在分布式系统中,分布式一致性是一个非常重要的概念,它是指分布式系统的各个服务器都保持 阅读全文
posted @ 2025-05-22 14:51 rebeca8 阅读(35) 评论(0) 推荐(0)
摘要: Mac使用Colima运行Docker 原文链接:https://piaohua.github.io/post/docker/20231028-mac-colima/ 2023-10-28 docker 2028 words 5 mins read Contents Installation 启动 阅读全文
posted @ 2025-04-24 22:12 rebeca8 阅读(553) 评论(0) 推荐(0)
摘要: 原文链接:https://zhuanlan.zhihu.com/p/22886116297 自从卸载Docker Desktop后,我一直在使用Colima。过去这三年中,它一直稳定可靠。但随着时间推移,我也逐渐发现了一些问题:Colima依然依赖Docker作为容器引擎,而且它基于第三方的Lima 阅读全文
posted @ 2025-04-24 22:08 rebeca8 阅读(520) 评论(0) 推荐(0)
摘要: Colima代替Docker Desktop(更换镜像源) Colima 在 Mac 上创建一个虚拟机并在其中安装 Docker Runtime(默认),Mac 上通过 docker cli 进行访问和普通使用 docker cli 无差别 特点 Intel and M1 Macs support 阅读全文
posted @ 2025-04-24 22:04 rebeca8 阅读(340) 评论(0) 推荐(0)
摘要: Docker Vs Podman 翻译自 Chetansingh 2020年4月24日的博文《Docker Vs Podman》 [1] 容器化的一场全新革命是从 Docker 开始的,Docker 的守护进程管理着所有的事情,并成为最受欢迎和广泛使用的容器管理系统之一。 但是,请稍等!您真的会假设 阅读全文
posted @ 2025-04-24 22:03 rebeca8 阅读(74) 评论(0) 推荐(0)
摘要: 转自:http://live.xiaohongshu.com.sdwan.ltd/index.php?m=home&c=View&a=index&aid=132 香港作为全球重要数据传输驿站之一,其网络传输能力自然不可小瞧。根据香港政府通讯事务管理局办公室给出的资料,截至2019年1月,香港有十一个 阅读全文
posted @ 2025-02-10 20:26 rebeca8 阅读(166) 评论(0) 推荐(0)
摘要: 转载自:https://qiaodahai.com/the-international-cable-systems-in-china.html 中国联通海陆缆现状 中国联通在中国运营商中拥有最丰富的国际网络资源,23条海缆系统中容量过1500G;陆缆连接相邻国家和地区,带宽接近2000G。 中国联通 阅读全文
posted @ 2025-02-10 20:11 rebeca8 阅读(214) 评论(1) 推荐(0)
摘要: /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" 如上方法,然后中间会要求输入管理员密码,然后就是将brew加到PATH需要敲几个交互命令 阅读全文
posted @ 2025-02-05 14:51 rebeca8 阅读(63) 评论(0) 推荐(0)
摘要: Ollama是一个功能强大的本地大语言模型的运行框架,用户可以非常简单地运行使用各种LLM。最最主要的是它完全免费,本地可以离线运行; 1. 最简单的安装: curl https://ollama.ai/install.sh | sh 2.也可以访问ollam.com直接点击下载安装 3. 安装完成 阅读全文
posted @ 2025-02-05 14:22 rebeca8 阅读(3940) 评论(0) 推荐(0)