摘要:
背景 大模型推理落地面临的核心矛盾:本地 GPU 有限但延迟/数据要求高,云上 GPU 弹性好但 7×24 成本高。 混合架构是务实的解法——本地 GPU 扛基础负载,云上 GPU 弹性兜底。本文记录基于 Amazon EKS、NVIDIA NIM、KEDA 和 Karpenter 的完整实现方案。 阅读全文
posted @ 2026-04-29 20:05
亚马逊云开发者
阅读(13)
评论(0)
推荐(0)
摘要:
最近在做短剧视频翻译的 PoC,遇到一个看起来简单实际很烦的问题——字幕擦除。你要先知道字幕在画面里的具体位置,才能擦掉原文贴上译文。 这篇文章记录我在两周内迭代六版算法的完整过程,从纯传统 CV 到纯视觉大模型再到混合方案,每一版的思路、代码和测试数据都在。 完整代码已开源:aws-samples 阅读全文
posted @ 2026-04-29 11:41
亚马逊云开发者
阅读(4)
评论(0)
推荐(0)
摘要:
问题 AWS Application Load Balancer 的网络接口(ENI)是动态管理的。每个可用区对应一个 ENI,ALB 扩展到新 AZ 时自动创建新 ENI。Traffic Mirror Session 绑定在具体 ENI 上——ENI 变了,Session 失效,部分流量漏采。 在 阅读全文
posted @ 2026-04-29 11:05
亚马逊云开发者
阅读(4)
评论(0)
推荐(0)
摘要:
需求场景 EKS 上的应用产生 JSON 格式的埋点日志(页面浏览、点击、交易等),需要以 Apache Parquet 格式落地 Amazon S3,供 Athena、Spark、Redshift Spectrum 做离线分析。 Parquet 列式存储对比 JSON,存储成本和查询扫描成本可降低 阅读全文
posted @ 2026-04-29 11:05
亚马逊云开发者
阅读(6)
评论(0)
推荐(0)
摘要:
问题背景 企业级 AWS 环境里,EC2、RDS、EKS、Lambda、ALB 交织运行,一个故障的排查路径可能跨越 CloudWatch 指标、CloudTrail 操作记录、VPC Flow Logs、Config 变更等多个数据源。人工关联这些数据,从告警触发到定位根因往往需要 30 分钟到数 阅读全文
posted @ 2026-04-29 11:05
亚马逊云开发者
阅读(7)
评论(0)
推荐(0)
摘要:
问题 AWS Application Load Balancer 的网络接口(ENI)是动态管理的。每个可用区对应一个 ENI,ALB 扩展到新 AZ 时自动创建新 ENI。Traffic Mirror Session 绑定在具体 ENI 上——ENI 变了,Session 失效,部分流量漏采。 在 阅读全文
posted @ 2026-04-29 08:07
亚马逊云开发者
阅读(8)
评论(0)
推荐(0)
摘要:
需求场景 EKS 上的应用产生 JSON 格式的埋点日志(页面浏览、点击、交易等),需要以 Apache Parquet 格式落地 Amazon S3,供 Athena、Spark、Redshift Spectrum 做离线分析。 Parquet 列式存储对比 JSON,存储成本和查询扫描成本可降低 阅读全文
posted @ 2026-04-29 08:07
亚马逊云开发者
阅读(8)
评论(0)
推荐(0)
摘要:
问题背景 企业级 AWS 环境里,EC2、RDS、EKS、Lambda、ALB 交织运行,一个故障的排查路径可能跨越 CloudWatch 指标、CloudTrail 操作记录、VPC Flow Logs、Config 变更等多个数据源。人工关联这些数据,从告警触发到定位根因往往需要 30 分钟到数 阅读全文
posted @ 2026-04-29 07:36
亚马逊云开发者
阅读(21)
评论(0)
推荐(0)

浙公网安备 33010602011771号