会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
滴滴滴--你不是爱拖延,而是爱逃避
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
5
6
7
8
9
10
11
12
13
···
129
下一页
2025年5月29日
RocketMQ学习
摘要: 目录 RocketMQ集群介绍 RocketMQ集群模式 1、单Master模式 2、多Master模式 3、多Master多Slave模式(异步) 4、多Master多Slave模式(同步) 双主双从集群搭建 1、服务器环境 2、防火墙配置 3、创建消息存储路径 4、Broker配置 1)Mast
阅读全文
posted @ 2025-05-29 13:57 滴滴滴
阅读(64)
评论(0)
推荐(0)
2025年5月28日
ConfigMap和环境变量 的区别
摘要: | 特性 | ConfigMap | 环境变量 || | | || **集中管理** | ✔️ 支持集中管理配置 | ❌ 分散在 Pod 定义中 || **使用方式** | ✔️ 支持挂载为卷或环境变量 | ✔️ 直接在 Pod 中声明 || **版本控制** | ✔️ 支持版本控制 | ❌ 无版本
阅读全文
posted @ 2025-05-28 20:26 滴滴滴
阅读(6)
评论(0)
推荐(0)
2025年3月28日
.gitlab-ci.yml 文件中,GitLab CI/CD 提供了一系列预定义的常量和变量
摘要: 在 .gitlab-ci.yml 文件中,GitLab CI/CD 提供了一系列预定义的常量和变量,这些常量和变量用于控制作业的行为、获取流水线信息等。以下是一些常见的预定义常量和变量: 预定义的 when 常量 这些常量用于控制作业的运行时机: always:无论前一个作业是否成功,该作业都会运行
阅读全文
posted @ 2025-03-28 11:08 滴滴滴
阅读(140)
评论(0)
推荐(0)
2025年2月17日
AI 要求
摘要: 熟悉InfiniBand(IB)和RDMA over Converged Ethernet(RoCE)网络的配置和优化。有成功部署和管理cube-studio的直接经验。容器编排(Kubernetes, Docker)、调度系统(Volcano, Kubeflow)、监控工具(Prometheus,
阅读全文
posted @ 2025-02-17 22:29 滴滴滴
阅读(38)
评论(0)
推荐(0)
2025年1月14日
EC2
摘要: 在AWS中,是否会更换实例的公网IP取决于您使用的IP地址类型。具体来说: 临时公网IP(也称为公共IP):当您启动一个新的EC2实例时,AWS会自动分配一个临时公网IP。如果您停止并重新启动该实例,临时公网IP会被释放,然后重新分配一个新的IP地址。因此,公网IP将会更换。 弹性公网IP(Elas
阅读全文
posted @ 2025-01-14 16:17 滴滴滴
阅读(98)
评论(0)
推荐(0)
2025年1月13日
NVIDIA GPU Operator
摘要: NVIDIA GPU Operator 是一个用于在 Kubernetes 集群上自动化部署、配置和管理 NVIDIA GPU 及相关硬件资源的工具。它通过 Kubernetes Operator 框架来实现自动化管理,简化了在 Kubernetes 环境中使用 GPU 的过程。以下是 NVIDIA
阅读全文
posted @ 2025-01-13 09:52 滴滴滴
阅读(415)
评论(0)
推荐(0)
k8s volcano + deepspeed多机训练 + RDMA ROCE+ 用户权限安全方案
摘要: 前提:nvidia、cuda、nvidia-fabricmanager等相关的组件已经在宿主机正确安装,如果没有安装可以参考我之前发的文章GPU A800 A100系列NVIDIA环境和PyTorch2.0基础环境配置【建议收藏】_a800多卡运行环境配置-CSDN博客文章浏览阅读1.1k次,点赞8
阅读全文
posted @ 2025-01-13 09:51 滴滴滴
阅读(1006)
评论(0)
推荐(0)
2025年1月12日
AI 顺序
摘要: AI 模型的开发、训练、推理和验证是一个系统的过程,涉及多个步骤。以下是详细的步骤流程: ### 1. 需求分析- **明确目标**:确定 AI 模型需要解决的具体问题,如图像分类、自然语言处理、语音识别等。- **定义性能指标**:确定评估模型性能的指标,如准确率、召回率、F1 分数等。 ###
阅读全文
posted @ 2025-01-12 07:15 滴滴滴
阅读(141)
评论(0)
推荐(0)
2025年1月11日
Ubuntu 22.04LTS版本二进制部署K8S 1.30+版本
摘要: Ubuntu 22.04LTS版本二进制部署K8S 1.30+版本 目录 一.K8S集群各主机环境准备 1.环境准备 2.所有节点安装常用的软件包 3.k8s-master01节点免密钥登录集群并同步数据 4.所有节点Linux基础环境优化 5.所有节点安装ipvsadm以实现kube-proxy的
阅读全文
posted @ 2025-01-11 15:06 滴滴滴
阅读(258)
评论(0)
推荐(0)
k8s AI
摘要: 1. RDMA ROCE 网卡 2. GPU插件device-plugin 3. gpu 虚拟化 4. volcano 调度 5. 网络选型cillum
阅读全文
posted @ 2025-01-11 13:27 滴滴滴
阅读(22)
评论(0)
推荐(0)
上一页
1
···
5
6
7
8
9
10
11
12
13
···
129
下一页
公告