摘要: 一、K8S集群架构说明 二、K8S集群主机配置 2.1 主机操作系统说明 序号 操作系统及版本 备注 1 CentOS7u9 2.2 主机软、硬件配置说明 需求 CPU 内存 硬盘 角色 主机名 软件 值 8C 8G 1024GB HA ha1 haproxy、keepalived 值 8C 8G 阅读全文
posted @ 2024-08-20 16:18 broadviews 阅读(623) 评论(0) 推荐(0)
摘要: Ubuntu 24.04.1 LTS 安装 Docker(国内源版,全程可访问) 以下是适配 Ubuntu 24.04 的 Docker 安装命令,全程使用阿里云国内源,避免官方源访问慢/超时问题,步骤简洁且可直接复制执行: 一、前置准备:卸载旧版本(避免冲突) 若之前装过 Docker 旧版本,先 阅读全文
posted @ 2025-12-10 10:09 broadviews 阅读(738) 评论(3) 推荐(0)
摘要: docker 构建 Jenkins2.528.2-1 打开一个终端窗口。 使用以下 docker network create 命令在 Docker 中创建一个 bridge 网络: docker network create jenkins 为了能在 Jenkins 节点中执行 Docker 命令 阅读全文
posted @ 2025-11-21 14:26 broadviews 阅读(35) 评论(0) 推荐(0)
摘要: 下面是一个在 8 核心 CPU + 16 GB 内存的 Linux 系统上,将 CPU 和内存同时打满的压测脚本方案,使用 stress-ng 工具来实现。 为什么选择 stress-ng 它是一个功能全面、灵活、强大的系统压力测试工具; 支持对 CPU、内存、I/O 等子系统施加压力; 可指定占用 阅读全文
posted @ 2025-09-10 16:32 broadviews 阅读(321) 评论(0) 推荐(0)
摘要: master 分支受保护(保护分支,禁止直接推送) 你是 开发者角色(dev),通常权限不足以 push 到 master 所以不能直接 git push origin master 这是标准的 Git 分支保护策略。正确流程一般是 在自己的分支开发 → 推送到远程 → 发起合并请求(Pull Re 阅读全文
posted @ 2025-09-04 16:41 broadviews 阅读(200) 评论(0) 推荐(0)
摘要: 保存为 toggle_power_plan.bat @echo off chcp 65001 >nul setlocal enabledelayedexpansion :: GUIDs set "HIGH_GUID=8c5e7fda-e8bf-4a96-9a85-a6e23a8c635c" set 阅读全文
posted @ 2025-06-17 09:58 broadviews 阅读(389) 评论(0) 推荐(0)
摘要: kubectl报错 [root@master03 ~]# kubectl get pod error: You must be logged in to the server (Unauthorized) 解决办法: [root@master03 ~]# sudo cp -i /etc/kubern 阅读全文
posted @ 2025-01-17 11:34 broadviews 阅读(256) 评论(0) 推荐(0)
摘要: 安装NVIDIA Driver 进入英伟达官网下载页面 按照以上方式选择即可得到>535.113.01版本的驱动,可以实现多卡推理,小于这个版本会导致多卡训练以及推理报错 虽然最新版本为550.54.15,但是535版本更加稳定,并且pytorch目前只支持到12.1,而在CUDA Toolkit选 阅读全文
posted @ 2024-12-26 14:34 broadviews 阅读(1131) 评论(0) 推荐(0)
摘要: 新增节点的步骤 将其他节点的server.properties配置文件拷贝后修改以下参数 broker.id log.dirs zookeeper.connect 数据迁移原理 只有新增的Topic才会将数据分布在新节点上,如果要将现有数据也分配到新节点,需要将Topic中的数据迁移到新节点上。 数 阅读全文
posted @ 2024-12-24 16:43 broadviews 阅读(274) 评论(0) 推荐(1)
摘要: 有些情况下,你想重启一个特定的容器,而不是删除pod,让Kubernetes重新创建它,可以使用: kubectl exec POD_NAME -c CONTAINER_NAME /sbin/killall5 也可以: kubectl exec POD_NAME -c CONTAINER_NAME 阅读全文
posted @ 2024-12-12 15:57 broadviews 阅读(240) 评论(0) 推荐(0)
摘要: 报错截图如下 查看etcd,发现超过默认值2G了 解决参考链接 https://cloud.tencent.com/developer/article/2360418 执行过程 PS: 高可用集群需要在所有master执行 # 1、获取当前的版本 $ rev=$(ETCDCTL_API=3 etcd 阅读全文
posted @ 2024-11-25 18:01 broadviews 阅读(295) 评论(0) 推荐(0)