摘要: 最近在倒腾“AI大模型基础设施”, 宏观目标是做一个基于云原生的AI算力平台,目前因公司隐私暂不能公开宏观背景和技术方案, 姑且记录实践中遇到的一些技能点。 前文已经记录了第1步: 使用arena 提交训练任务的实践。 今天我们记录聊一聊平台侧另一个核心能力: 动态纳管云原生k8s集群,并监听AI/ 阅读全文
posted @ 2025-08-05 19:56 码甲哥不卷 阅读(160) 评论(0) 推荐(0)