上一页 1 2 3 4 5 6 7 ··· 38 下一页

2024年5月3日

容器化部署Tengine worker数量问题

摘要: 当容器化部署Tengine时,worker数量默认是cpu数量。 https://tengine.taobao.org/document_cn/core_cn.html 对应/etc/nginx/nginx.conf数量配置是4。 容器中cpu数量是节点cpu数量,Nginx不需要这么多worker 阅读全文

posted @ 2024-05-03 20:29 王景迁 阅读(1) 评论(0) 推荐(0) 编辑

使用GPU

摘要: 使用场景 物理机上GPU卡被挂载到容器中,容器中安装GPU驱动来管理GPU。 约束 k8s对GPU设备的管理只能处理设备个数这一种情况。GPU产品有AMD和NVIDIA,在k8s中对应amd.com/gpu和nvidia.com/gpu。GPU数量只能设置在limits,requests默认与lim 阅读全文

posted @ 2024-05-03 16:30 王景迁 阅读(1) 评论(0) 推荐(0) 编辑

GPU插件介绍

摘要: 对于NVIDIA GPU,存在3种设备插件的实现。 官方NVIDIA GPU插件 要求1. 节点安装了NVIDIA驱动。2. 节点安装nvidia-docker 2.0。3. Docker的默认运行时必须设置为nvidia-container-runtime,而不是runc。4. NVIDIA 驱动 阅读全文

posted @ 2024-05-03 15:25 王景迁 阅读(2) 评论(0) 推荐(0) 编辑

增加调用链来获取chown的调用方

摘要: # 重命名/usr/bin/chown二进制文件为real_chown mv /usr/bin/chown /usr/bin/real_chown # 编写脚本来调用real_chown vim /usr/bin/chown chown_log="/var/log/chown.log" date > 阅读全文

posted @ 2024-05-03 15:00 王景迁 阅读(1) 评论(0) 推荐(0) 编辑

execsnoop排查ovs短时进程导致CPU升高

摘要: 问题现象 节点CPU间隔一段时间后会冲高。通过execsnoop捕捉到在创建网桥(删除网桥捕捉不到,因为删除时不需要确认状态)。 # 安装execsnoop git clone --depth 1 https://github.com/brendangregg/perf-tools ./perf-t 阅读全文

posted @ 2024-05-03 14:27 王景迁 阅读(4) 评论(0) 推荐(0) 编辑

容器因存在不可删除文件而无法删除

摘要: # 容器开启特权,设置文件不可删除 touch a chattr +a a 可以stop,但是无法rm。 去掉可读写层overlay2 upperdir中/a文件不可删除属性后,容器可以删除。 阅读全文

posted @ 2024-05-03 10:40 王景迁 阅读(1) 评论(0) 推荐(0) 编辑

2024年5月2日

Etcd因磁盘IO高而写操作慢

摘要: 问题现象 now := time.Now() if err := kubeClient.CoreV1().Pods("default").Delete(context.Background(), "busybox-7879d986c8-q99t5", metav1.DeleteOptions{}); 阅读全文

posted @ 2024-05-02 17:08 王景迁 阅读(4) 评论(0) 推荐(0) 编辑

klog在日志文件中error级别日志重复打印2次

摘要: 问题现象 package main import ( "flag" "gopkg.in/natefinch/lumberjack.v2" "k8s.io/klog/v2" ) func main() { klog.InitFlags(nil) flag.Set("logtostderr", "fal 阅读全文

posted @ 2024-05-02 09:57 王景迁 阅读(6) 评论(0) 推荐(0) 编辑

2024年5月1日

kube-ovn 默认vpc和默认subnet 主机和容器互通

摘要: 默认vpc是ovn-cluster,默认subnet是ovn-default。ovn0 ip是100.64.0.0/16网段。 同节点 容器访问主机 主机访问容器 跨节点 容器访问主机 主机访问容器 阅读全文

posted @ 2024-05-01 16:47 王景迁 阅读(3) 评论(0) 推荐(0) 编辑

2024年4月30日

k8s限速队列使用场景分析

摘要: 场景1:add->add->get->get package main import ( "fmt" "k8s.io/client-go/util/workqueue" ) func main() { queue := workqueue.NewRateLimitingQueue(workqueue 阅读全文

posted @ 2024-04-30 09:14 王景迁 阅读(2) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 ··· 38 下一页

导航