摘要:
本文记录了在 AWS SageMaker Notebook 实例(ml.g4dn.xlarge,Tesla T4 16GB)上,使用 vLLM 和 transformers 部署 Qwen3-4B 与 Qwen3.5-4B 两个模型,并通过自定义基准测试进行对比评测的完整过程。 Qwen3-4B v 阅读全文
posted @ 2026-05-13 18:56
zhaojie10
阅读(14)
评论(0)
推荐(0)
摘要:
ecr-credential-provider的工作原理 Kubernetes 从 v1.20 开始引入 kubelet image credential provider 插件机制(KEP-2133),用于替代之前内置在 kubelet 中的云厂商镜像凭证逻辑。AWS 的实现就是 ecr-cred 阅读全文
posted @ 2026-05-13 14:13
zhaojie10
阅读(3)
评论(0)
推荐(0)
摘要:
Spark 任务提交模式 在 EMR 上,传统上 Spark 作业通过 spark-submit 提交到 YARN,有两种 deploy mode: cluster 模式(EMR 默认/推荐):用户 SSH 到 Primary 节点 → spark-submit --deploy-mode clus 阅读全文
posted @ 2026-05-13 11:34
zhaojie10
阅读(7)
评论(0)
推荐(0)

浙公网安备 33010602011771号