1. cmdb启动不起来,检查kafka起不来

/data/install/bkcec start cmdb  #启动cmdb
/data/install/bkcec start kafka  #启动kafka
/data/install/bkcec status kafka  #查看失败
ls /data/bkce/logs/kafka    #查看日志,发现是连接不上zk,解析不了zk域名
/data/install/bkcec status zk #zk状态查看到是正常的
问题分析:
第一次部署的时候脚本会添加本地dns,但是机器重启后丢失了
问题解决:
添加本地dns
vi /etc/resolv.conf
在前面添加多一行: nameserver 127.0.0.1    #蓝鲸脚本有这个步骤,但虚拟机重启后消失
永久添加:
vi /etc/sysconfig/network-scripts/ifcfg-eth0
dns1=127.0.0.1
dns2=你原来的dns
全部重启:
/data/install/bkcec stop all
/data/install/bkcec start all

2.saas重启失败

#!/bin/bash
for dir in `ls -l /data/bkce/paas_agent/apps/Envs/ |awk '{print $9}'`
do
    echo $dir
    rm -rf /data/bkce/paas_agent/apps/projects/$dir/run/supervisord.sock
    cd /data/bkce/paas_agent/apps/Envs/$dir/bin/
    ./supervisord -c /data/bkce/paas_agent/apps/projects/$dir/conf/supervisord.conf
    ./supervisorctl -c /data/bkce/paas_agent/apps/projects/$dir/conf/supervisord.conf start all
    ./supervisorctl -c /data/bkce/paas_agent/apps/projects/$dir/conf/supervisord.conf status all
done

 或者删掉原先目录/data/bkce/paas_agent/apps/,重新部署

rm -rf /data/bkce/paas_agent/apps/projects/$dir/run/supervisord.sock  这个删除了也可以重新部署

成功的修改代码手动重启,以
#修改改目录下源码
/data/bkce/paas_agent/apps/projects/bk_framework/code/bk_framework
#进入环境工具目录
cd /data/bkce/paas_agent/apps/Envs/bk_framework/bin
#重启应用
./supervisorctl -c /data/bkce/paas_agent/apps/projects/bk_framework/conf/supervisord.conf stop all
./supervisorctl -c /data/bkce/paas_agent/apps/projects/bk_framework/conf/supervisord.conf start all

3.内网部署找不到mysqlclient

 

解决方法:做软链接

ln  -s usr/lib64/msyql /usr/lib/mysql

ln -s  /data/src/service/mysql/lib/libmysqlclient.so.20  /usr/lib64/libmysqlclient.so.20

 

4.服务器没有外网,只能内网访问

下载CentOS 7的iso镜像文件:
http://mirrors.huaweicloud.com/centos/7.7.1908/isos/x86_64/

下载EPEL的镜像文件:
https://bk.tencent.com/docs/document/5.1/20/635?r=1
目前最新只有7.5,所以这里选择下载7.5版本的 bk_offline_repo-7.5.1804.iso,一般情况下问题不大。

因为要求是离线部署,所以默认机器不能连外网,需要配置本地 YUM 源。

mkdir -p /media/cdrom
mount -o loop -t iso9660 /data/CentOS-7-x86_64-DVD-1908.iso /media/cdrom

mkdir -p /media/cdrom-epel
mount -o loop -t iso9660 /data/bk_offline_repo-7.5.1804.iso /media/cdrom-epel
新建repo配置文件:vi /etc/yum.repos.d/CentOS.repo,编辑内容如下:

[CentOS7]
name=CentOS7
baseurl=file:///media/cdrom/
enabled=1
gpgcheck=0

[CentOS7-epel]
name=CentOS7-epel
baseurl=file:///media/cdrom-epel/
enabled=1
gpgcheck=0
可以创建一个bak目录,将其他的repo配置文件都统一mv备份到bak目录中。

配置好 YUM 源,包含 EPEL 仓库(可以通过 yum info nginx 测试下)。

 5.安装蓝鲸监控saas超时问题

修改文件:/data/bkee/etc/paas_agent_config.yaml 
将EXECUTE_TIME_LIMT:300  改为1200

修改文件:/data/bkee/open_paas/paas/conf/default.py
将EVENT_STATE_EXPIRE_SECONDS = 360  改为1260

重启appo 
/data/install/bkcec stop appo
/data/install/bkcec start appo
重启paas
/data/install/bkcec stop paas
/data/install/bkcec start paas

全部启动:
/data/install/bkcec start all

  6.单机版本创建自己的应用后无法部署

#蓝鲸要求测试服务器和正式服务器不能在同一台
测试环境/正式环境分别只能激活一台服务器
单机版默认是激活正式环境
蓝鲸部署自己应用要求先在测试环境发布
#解决方法
创建应用时修改:open_pass数据库
表:paas_app
把自己的saas状态state改为3

7.离线环境下部署saas需要下载包

1.有网机器下载包
pip download -d /home/sss -r requirement.txt
2.拷贝包到support-files目录下pkgs
find / -name pkgs
/data/bkce/paas_agent/support-files/pkgs/
3.修改paas_agent_config.yaml
find / -name paas_agent_config.yaml
USE PYPI:'true'  改为 'false'
4.重启appo 
#尴尬的是上面的方法没有用
find / -name build
vi   /data/bkce/paas_agent/paas_agent/etc/build/virtualenv/build
#找到pip install  那一行注释掉
pip install -r requirements.txt --no-index --find-links=file:/data/bkce/paas_agent/support-files/pkgs

 

posted on 2020-01-08 10:38  聪神carry  阅读(324)  评论(0编辑  收藏  举报