1. cmdb启动不起来,检查kafka起不来
/data/install/bkcec start cmdb #启动cmdb /data/install/bkcec start kafka #启动kafka /data/install/bkcec status kafka #查看失败 ls /data/bkce/logs/kafka #查看日志,发现是连接不上zk,解析不了zk域名 /data/install/bkcec status zk #zk状态查看到是正常的 问题分析: 第一次部署的时候脚本会添加本地dns,但是机器重启后丢失了 问题解决: 添加本地dns vi /etc/resolv.conf 在前面添加多一行: nameserver 127.0.0.1 #蓝鲸脚本有这个步骤,但虚拟机重启后消失 永久添加: vi /etc/sysconfig/network-scripts/ifcfg-eth0 dns1=127.0.0.1 dns2=你原来的dns
全部重启:
/data/install/bkcec stop all
/data/install/bkcec start all
2.saas重启失败
#!/bin/bash for dir in `ls -l /data/bkce/paas_agent/apps/Envs/ |awk '{print $9}'` do echo $dir rm -rf /data/bkce/paas_agent/apps/projects/$dir/run/supervisord.sock cd /data/bkce/paas_agent/apps/Envs/$dir/bin/ ./supervisord -c /data/bkce/paas_agent/apps/projects/$dir/conf/supervisord.conf ./supervisorctl -c /data/bkce/paas_agent/apps/projects/$dir/conf/supervisord.conf start all ./supervisorctl -c /data/bkce/paas_agent/apps/projects/$dir/conf/supervisord.conf status all done
或者删掉原先目录/data/bkce/paas_agent/apps/,重新部署
rm -rf /data/bkce/paas_agent/apps/projects/$dir/run/supervisord.sock 这个删除了也可以重新部署
成功的修改代码手动重启,以
#修改改目录下源码 /data/bkce/paas_agent/apps/projects/bk_framework/code/bk_framework #进入环境工具目录 cd /data/bkce/paas_agent/apps/Envs/bk_framework/bin #重启应用 ./supervisorctl -c /data/bkce/paas_agent/apps/projects/bk_framework/conf/supervisord.conf stop all
./supervisorctl -c /data/bkce/paas_agent/apps/projects/bk_framework/conf/supervisord.conf start all
3.内网部署找不到mysqlclient
解决方法:做软链接 ln -s usr/lib64/msyql /usr/lib/mysql ln -s /data/src/service/mysql/lib/libmysqlclient.so.20 /usr/lib64/libmysqlclient.so.20
4.服务器没有外网,只能内网访问
下载CentOS 7的iso镜像文件: http://mirrors.huaweicloud.com/centos/7.7.1908/isos/x86_64/ 下载EPEL的镜像文件: https://bk.tencent.com/docs/document/5.1/20/635?r=1 目前最新只有7.5,所以这里选择下载7.5版本的 bk_offline_repo-7.5.1804.iso,一般情况下问题不大。 因为要求是离线部署,所以默认机器不能连外网,需要配置本地 YUM 源。 mkdir -p /media/cdrom mount -o loop -t iso9660 /data/CentOS-7-x86_64-DVD-1908.iso /media/cdrom mkdir -p /media/cdrom-epel mount -o loop -t iso9660 /data/bk_offline_repo-7.5.1804.iso /media/cdrom-epel 新建repo配置文件:vi /etc/yum.repos.d/CentOS.repo,编辑内容如下: [CentOS7] name=CentOS7 baseurl=file:///media/cdrom/ enabled=1 gpgcheck=0 [CentOS7-epel] name=CentOS7-epel baseurl=file:///media/cdrom-epel/ enabled=1 gpgcheck=0 可以创建一个bak目录,将其他的repo配置文件都统一mv备份到bak目录中。 配置好 YUM 源,包含 EPEL 仓库(可以通过 yum info nginx 测试下)。
5.安装蓝鲸监控saas超时问题
修改文件:/data/bkee/etc/paas_agent_config.yaml 将EXECUTE_TIME_LIMT:300 改为1200 修改文件:/data/bkee/open_paas/paas/conf/default.py 将EVENT_STATE_EXPIRE_SECONDS = 360 改为1260 重启appo /data/install/bkcec stop appo /data/install/bkcec start appo 重启paas /data/install/bkcec stop paas /data/install/bkcec start paas
全部启动:
/data/install/bkcec start all
6.单机版本创建自己的应用后无法部署
#蓝鲸要求测试服务器和正式服务器不能在同一台 测试环境/正式环境分别只能激活一台服务器 单机版默认是激活正式环境 蓝鲸部署自己应用要求先在测试环境发布 #解决方法 创建应用时修改:open_pass数据库 表:paas_app 把自己的saas状态state改为3
7.离线环境下部署saas需要下载包
1.有网机器下载包 pip download -d /home/sss -r requirement.txt 2.拷贝包到support-files目录下pkgs find / -name pkgs /data/bkce/paas_agent/support-files/pkgs/ 3.修改paas_agent_config.yaml find / -name paas_agent_config.yaml USE PYPI:'true' 改为 'false' 4.重启appo
#尴尬的是上面的方法没有用 find / -name build vi /data/bkce/paas_agent/paas_agent/etc/build/virtualenv/build #找到pip install 那一行注释掉 pip install -r requirements.txt --no-index --find-links=file:/data/bkce/paas_agent/support-files/pkgs
作者:陈耿聪 —— 夕狱
出处:https://www.cnblogs.com/CGCong/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。