cloudpilot-ai

导航

2025年6月25日 #

揭秘 Anthropic 如何降低 Claude 模型的训练与推理成本

摘要: 揭秘 Anthropic 如何降低 Claude 模型的训练与推理成本 01/引言 在 GenAI 时代,云成本达到了历史新高。这并不仅仅因为企业使用了更多计算资源,而是他们没有高效地利用这些资源。 根据 Harness 的研究,预计今年的企业云支出浪费将高达 445 亿美元,相当于每分钟烧掉 8.5 万美元。 Anthropic 是一家 AI 初创公司,总部位于旧金山 阅读全文

posted @ 2025-06-25 18:07 CloudPilotAI 阅读(65) 评论(0) 推荐(0)

2025年6月23日 #

Netvue利用CloudPilot AI,实现GPU降本52%,用AI守护千家万户的居家安全

摘要: Netvue利用CloudPilot AI,实现GPU降本52%,用AI守护千家万户的居家安全 公司简介 「Netvue」成立于2010年,是全球领先的智能家居软硬件解决方案提供商,专注于家庭安全监控。 Netvue 将专业安防摄像机与先进的 AI 技术相结合,提供与设备相互协同工作的 Netvue 云服务,支持用户实时查看监控视频画面,并智能识别可疑人员。目前,Netvue 已服务全球超过 阅读全文

posted @ 2025-06-23 15:49 CloudPilotAI 阅读(36) 评论(0) 推荐(0)

2025年6月19日 #

弹性伸缩从可用到好用,中间差了这 8 个关键点——CloudPilot AI 如何补齐?

摘要: 弹性伸缩从可用到好用,中间差了这 8 个关键点——CloudPilot AI 如何补齐? 在 Kubernetes 中,资源管理一直是个难题。配置复杂、调优困难,容易导致资源浪费和成本上升。虽然 Cluster Autoscaler 提供了基础的自动扩缩能力,但由于依赖节点组机制,响应慢、配置繁琐。 Karpenter 作为更灵活的替代方案,通过直接与云厂商交互加快了扩缩容速度,简化了管 阅读全文

posted @ 2025-06-19 15:55 CloudPilotAI 阅读(61) 评论(0) 推荐(0)

2025年6月16日 #

年吞百万请求,全球知名自由职业平台Fiverr的K8s弹性伸缩方案升级

摘要: 年吞百万请求,全球知名自由职业平台Fiverr的K8s弹性伸缩方案升级 Fiverr 是全球知名的自由职业在线平台之一,成立于2010年,目前在全球拥有400万买家,年度交易额达11.3亿美元。 本文将介绍 Fiverr 基础设施团队在 2024 年完成的一项迁移实践,详细记录了他们如何从 Kubernetes 迁移至 Karpenter,并从中获得了哪些收益。另外,还 阅读全文

posted @ 2025-06-16 17:47 CloudPilotAI 阅读(55) 评论(0) 推荐(0)

2025年6月12日 #

面对3倍流量激增,「纽约时报」如何既稳又省?

摘要: 面对3倍流量激增,「纽约时报」如何既稳又省? 引言 在这个信息爆炸的时代,一条突发新闻可能会在几分钟内吸引上百万用户同时涌入网站。 作为全球最具影响力的新闻机构之一,《纽约时报》如何应对这样的超高流量冲击?如何有效减少流量高峰期资源配置下的高昂成本?如何在短时间内完成快速弹性伸缩? 本文根据《纽约时报》高级软件工程师 Mel Cone 和 De 阅读全文

posted @ 2025-06-12 16:47 CloudPilotAI 阅读(32) 评论(0) 推荐(0)

2025年6月9日 #

详解K8s 1.33原地扩缩容功能:原理、实践、局限与发展

摘要: 详解K8s 1.33原地扩缩容功能:原理、实践、局限与发展 你是否有过这样的经历? 精心配置了 Kubernetes 的 Pod,设置了“刚刚好”的 CPU 和内存(至少你当时是这么想的),结果应用不是资源紧张喘不过气,就是像“双十一”抢购一样疯狂抢占资源。 过去,唯一的解决办法就是重启整个Pod ——这种破坏性的做法就像用黄油刀做开胸手术,而 SRE 团队 阅读全文

posted @ 2025-06-09 12:12 CloudPilotAI 阅读(314) 评论(0) 推荐(0)

2025年5月30日 #

别让 Spot 中断影响你下班!7 个策略教你优雅化解

摘要: 别让 Spot 中断影响你下班!7 个策略教你优雅化解 使用 AWS Spot 实例可以显著降低云成本,最多可比按需实例节省 90%。对于 Kubernetes 集群而言,Spot 实例尤其适合运行具备弹性、非关键或突发型的工作负载,是实现性价比的理想选择。 不过,Spot 实例自带“中断风险”——AWS 仅提前 2 分钟发出终止通知(CloudPilo 阅读全文

posted @ 2025-05-30 13:47 CloudPilotAI 阅读(79) 评论(0) 推荐(0)

2025年5月21日 #

两招搞定K8s改造?全球领先数据云Snowflake这样做

摘要: 两招搞定K8s改造?全球领先数据云Snowflake这样做 Snowflake 的 IT 云运营团队迎来了云基础设施演进的关键转折点。随着 Amazon EKS 上容器化工作负载规模不断扩大,他们亟需一个更现代、安全且高效的操作系统。 其原有基于 Amazon Linux 2(AL2)的架构虽能运行,却存在多重挑战: 安全加固需频繁更新补丁导致运维负担加重; 阅读全文

posted @ 2025-05-21 11:57 CloudPilotAI 阅读(47) 评论(0) 推荐(0)

2025年5月16日 #

年薪百万,每周只干5小时,硅谷工程师开始“摆烂”了?

摘要: 年薪百万,每周只干5小时,硅谷工程师开始“摆烂”了? 想象一下: 你每天最多上线 1~2 次写点代码,偶尔发几封邮件,开两个会,然后收工,远程办公,一年照样拿 20–30 万美金的年薪。 这不是梦,也不是段子——而是在硅谷真实存在的“幽灵工程师”。 01/幽灵工程师是啥? 最近几周,斯坦福商学院的研究员 Yegor Denisov-Blanch 对全球 阅读全文

posted @ 2025-05-16 17:36 CloudPilotAI 阅读(86) 评论(0) 推荐(0)

2025年5月14日 #

“海外滴滴”Uber的Arm迁移实录:重构大规模基础设施​

摘要: “海外滴滴”Uber的Arm迁移实录:重构大规模基础设施​ 云工作负载在性价比上的自然演进路径: Intel ➜ AMD ➜ ARM 不信?来看看 Uber 的做法: 01/Arm架构:云计算新时代 2023 年 2 月,Uber 正式开启了一项战略性迁移:将从本地数据中心迁移至云端,采用 Oracle Cloud Infrastructure(OCI)和 阅读全文

posted @ 2025-05-14 17:07 CloudPilotAI 阅读(80) 评论(0) 推荐(0)