摘要:
文章目录前言一、创建 k8s 集群二、启用 primary network三、启用 secondary networkk8s-rdma-shared-dev-pluginMultus CNISecondary CNIMulti-Network CRD四、启用 pod五、在 pod 中启动 RoCE 阅读全文
posted @ 2024-12-05 14:55
滴滴滴
阅读(935)
评论(0)
推荐(0)
摘要:
原生 kubernetes 调度器只能基于资源的 resource request 进行调度,然而 Pod 的真实资源使用率,往往与其所申请资源的 request/limit 差异很大,导致集群负载不均的问题。 crane-scheduler基于集群的真实负载数据构造了一个简单却有效的模型,作用于调 阅读全文
posted @ 2024-12-05 14:15
滴滴滴
阅读(61)
评论(0)
推荐(0)
摘要:
跑AI大模型的K8s与普通K8s有什么不同? 摘要:在面对大模型AI火热的当下,咱们从程序员三大件“计算、存储、网络”出发,一起看看这种跑大模型AI的K8s与普通的K8s有什么区别?有哪些底层就可以构筑AI竞争的地方。 本文分享自华为云社区《跑AI大模型的K8s与普通K8s有什么不同?》,作者:ts 阅读全文
posted @ 2024-12-05 14:00
滴滴滴
阅读(277)
评论(0)
推荐(0)
摘要:
net.ipv4.tcp_max_syn_backlog & net.core.somaxconn TCP SYN_REVD, ESTABELLISHED 状态对应的队列 TCP 建立连接时要经过 3 次握手,在客户端向服务器发起连接时,对于服务器而言,一个完整的连接建立过程,服务器会经历 2 种 阅读全文
posted @ 2024-12-05 07:50
滴滴滴
阅读(208)
评论(0)
推荐(0)