随笔分类 -  linux

运维工作
摘要:安装nvidia 驱动不再赘述 安装gcc 环境 sudo apt-get install build-essential sudo portaudio19-dev unzip x11-utils 1build-essential 用于安装一个软件包集合,其中包含了编译软件时经常需要使用的工具和库。 阅读全文
posted @ 2024-05-06 20:19 萱乐庆foreverlove 阅读(54) 评论(0) 推荐(0)
摘要:### 问题现象 #### 背景介绍 目前prometheus (本地存储一小时数据)收集指标 victroriametrics 负责存储 [项目地址](https://github.com/VictoriaMetrics/VictoriaMetrics "项目地址") grafana 村victo 阅读全文
posted @ 2023-07-04 15:28 萱乐庆foreverlove 阅读(131) 评论(0) 推荐(0)
摘要:默认sudo 过程中会进行 env_reset ``` Defaults always_query_group_plugin Defaults env_reset Defaults env_keep = "COLORS DISPLAY HOSTNAME HISTSIZE KDEDIR LS_COLO 阅读全文
posted @ 2023-07-01 13:55 萱乐庆foreverlove 阅读(119) 评论(0) 推荐(0)
摘要:### N 卡 ##### cuda 和 nivdia 驱动 CUDA是一种并行计算平台和编程模型,用于在GPU上运行高性能计算应用程序。CUDA深度学习框架是建立在CUDA平台之上的深度学习框架,其中包括: TensorFlow:由Google开发的开源深度学习框架,支持CPU和GPU加速。Ten 阅读全文
posted @ 2023-06-15 10:36 萱乐庆foreverlove 阅读(184) 评论(0) 推荐(0)
摘要:###SENTRY数据软清理 (清理完不会释放磁盘,如果很长时间没有运行,清理时间会很长) #登录worker容器 docker exec -it sentry_onpremise_worker_1 /bin/bash #保留多少天的数据,cleanup使用delete命令删除postgresql数 阅读全文
posted @ 2022-12-26 15:48 萱乐庆foreverlove 阅读(1090) 评论(0) 推荐(0)
摘要:脚本 点击查看代码 #!/bin/bash mkdir /tmp/tcpdump export TcpDump=tcpdump export SliPackeLen=0 export SliptCapPacket=50000 for ((iLoop=0; iLoop<1000; iLoop++)) 阅读全文
posted @ 2022-06-28 15:55 萱乐庆foreverlove 阅读(150) 评论(0) 推荐(0)
摘要:###环境介绍 gitlab版本 gitlab-ce-14.10.2-ce.0.el7.x86_64.rpm os版本 CentOS Linux release 7.7.1908 (Core) 系统架构 : Model name: Intel(R) Xeon(R) Platinum 8272CL C 阅读全文
posted @ 2022-05-19 19:48 萱乐庆foreverlove 阅读(189) 评论(0) 推荐(0)
摘要:点击查看代码 Apr 11 12:50:41 yewu-log-es-wldata03 kernel: INFO: task jbd2/sdb-8:19693 blocked for more than 120 seconds. Apr 11 12:50:41 yewu-log-es-wldata0 阅读全文
posted @ 2022-04-11 20:47 萱乐庆foreverlove 阅读(366) 评论(0) 推荐(0)
摘要:#A gitignore file specifies intentionally untracked files that Git should ignore. Files already tracked by Git are not affected; see the NOTES below f 阅读全文
posted @ 2022-03-15 11:42 萱乐庆foreverlove 阅读(26) 评论(0) 推荐(0)
摘要:snap方式安装certbot certbot 是python 工具安装和升级容易造成包损坏等相关问题。 使用官方推荐方式安装 ,这里依赖了一个三方的环境隔离软件snap https://certbot.eff.org/instructions?ws=other&os=centosrhel7 使用阿 阅读全文
posted @ 2022-01-10 21:26 萱乐庆foreverlove 阅读(281) 评论(0) 推荐(0)
摘要:算法同学想自己提升下主机的glibc版本,区别运维同学使用container的方式来解决环境问题。他们直接做以下操作 wget http://ftp.gnu.org/gnu/glibc/glibc-2.28.tar.gz tar zxvf glibc-2.28.tar.gz cd glibc-2.2 阅读全文
posted @ 2021-09-16 10:57 萱乐庆foreverlove 阅读(469) 评论(0) 推荐(0)
摘要:1. 查看本机scsi 接口 [root@data04 ~]# smartctl --scan /dev/sda -d scsi # /dev/sda, SCSI device /dev/sdb -d scsi # /dev/sdb, SCSI device /dev/bus/0 -d megara 阅读全文
posted @ 2021-09-13 19:42 萱乐庆foreverlove 阅读(498) 评论(0) 推荐(0)
摘要:故障问题 [root@host1 ~]# df -h 文件系统 容量 已用 可用 已用% 挂载点 /dev/vda1 40G 38G 0 100% / devtmpfs 3.7G 0 3.7G 0% /dev tmpfs 3.7G 0 3.7G 0% /dev/shm tmpfs 3.7G 356M 阅读全文
posted @ 2021-09-02 19:53 萱乐庆foreverlove 阅读(267) 评论(0) 推荐(0)
摘要:1. webhook 请求次数过大造成服务崩溃 解决思路是gitlab自己持有prometheus metrics 指标,其中sidekiq 服务负责backend job 执行。可以监控web_hook 运行队列的长度来决定是否存在故障。 官网issue 查看队列信息并手动清理到 web_hook 阅读全文
posted @ 2021-09-02 17:21 萱乐庆foreverlove 阅读(336) 评论(0) 推荐(0)
摘要:依赖工具 rssh yum install rssh -y 修改 /etc/rssh.conf 文件 # set the log facility. "LOG_USER" and "user" are equivalent.logfacility = LOG_USER # Leave these a 阅读全文
posted @ 2021-08-21 00:41 萱乐庆foreverlove 阅读(179) 评论(0) 推荐(0)
摘要:https://axkibe.github.io/lsyncd/manual/config/layer4/ 阅读全文
posted @ 2021-08-12 00:03 萱乐庆foreverlove 阅读(33) 评论(0) 推荐(0)
摘要:服务器和我们的办公电脑结构基本一样。系统调优思路很类似,总结为一句话就是在服务器有限的生命周期内让他们发挥最大的性能。 节能方式 linux redhat 发行版本为例 主要是tuned 命令 cpu调度策略 开启cpu 性能模式保持最大HZ 磁盘调度策略 muna 调节 内核参数 参考文档:htt 阅读全文
posted @ 2021-05-02 23:46 萱乐庆foreverlove 阅读(75) 评论(0) 推荐(0)
摘要:get http://ftp.tsukuba.wide.ad.jp/software/gcc/releases/gcc-4.9.0/gcc-4.9.0.tar.gztar xf gcc-4.9.0.tar.gz cd gcc-4.9.0ls./configure --disable-multilib 阅读全文
posted @ 2021-04-15 12:31 萱乐庆foreverlove 阅读(470) 评论(0) 推荐(0)
摘要:申请证书时选择apache 服务器和 nginx服务器。返回的证书规格是不同的 Apache WEB引擎安装SSL 我们需要先在Apache根目录下 conf/httpd.conf 文件,找到 #LoadModule ssl_module modules/mod_ssl.so 和 #Include 阅读全文
posted @ 2021-01-27 15:45 萱乐庆foreverlove 阅读(1331) 评论(0) 推荐(0)
摘要:接收到Alert,根据labels判断属于哪些Route(可存在多个Route,一个Route有多个Group,一个Group有多个Alert) 将Alert分配到Group中,没有则新建Group 新的Group等待group_wait指定的时间(等待时可能收到同一Group的Alert),根据r 阅读全文
posted @ 2021-01-15 21:37 萱乐庆foreverlove 阅读(111) 评论(0) 推荐(0)