蓝鲸智云社区版6.2部署二进制版

前言:

该版本是截止到文章编写的最新版,大部分文章可通过蓝鲸社区官方网,查看以下为链接:
https://bk.tencent.com/docs/markdown/ZH/DeploymentGuides/6.2/BasicInstall/MultiDeploy/quick_install.md
https://bk.tencent.com/docs/markdown/ZH/DeploymentGuides/6.2/BasicInstall/EnvPreparation/get_ready.md
我这里所使用的只有基础套餐并没有将额外增值套餐进行安装

相关文件下载链接
安装包:
https://bkopen-1252002024.file.myqcloud.com/ce/bkce-src-6.2.1.tgz
证书文件:
https://bk.tencent.com/download_ssl/

环境准备阶段:

准备三台机子,我这里准备的三台机子均是CentOS7,选择一台你喜欢的机子当中控即可,灵活变通一些配置文件

我这里就选择192.168.107.74

192.168.107.74 ----主控

192.168.107.75

192.168.107.76
按照官方的配置要求的话就是:

CPU:8核

内存:32G

硬盘存储:100G

在我实际使用的过程中发现:最好是能将核心数和硬盘容量扩大到8核以上,硬盘存储至少要200G,不然会产生一些意想不到的错误,我非常推荐这个平台在虚拟化平台上部署,因为总能出现一点小问题BUG。


安装过程注意事项:
在部署主机系统的时候,请选择最小化安装,以及自行分配存储空间,不然按照自动分配,会将大部分的空间分配到home卷,这在后续系统中运行非常致命,我推荐将硬盘存储的大部分空间,均分配给根号(/)这个挂载点

三台机子同时部署以下程序以及设置

配置腾讯网络yum源
wget -O /etc/yum.repos.d/epel.repo http://mirrors.cloud.tencent.com/repo/epel-7.repo
wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.cloud.tencent.com/repo/centos7_base.repo

yum clean all
yum makecache
#如非必要,不要选择离线安装,部署非常困难而且BUG居多,因为智云平台为了稳定性都是只装特定版本的工具和命令


# 通过命令临时禁用 SELinux
setenforce 0

# 或者修改配置文件
sed -i 's/^SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config\


# 检查默认防火墙状态,如果返回 not running,可以跳过后面的命令
firewall-cmd --state

#停止并禁用 firewalld
systemctl stop firewalld    # 停止 firewalld
systemctl disable firewalld # 禁用 firewall 开机启动

# 检查是否有 rsync 命令,如果有返回 rsync 路径,可以跳过后面的命令
which rsync

# 如果没有,请安装 rsync
yum -y install rsync

# 检查是否有 pssh 命令,如果有返回 pssh 路径,可以跳过后面的命令
which pssh

# 如果没有,请安装 pssh
yum -y install pssh

# 检查是否有 jq 命令,如果有返回 jq 路径,可以跳过后面的命令

# 如果没有,请安装jq 
yum -y install jq

# 检查当前 root 账号下的 max open files 值
ulimit -n

#调整最大文件打开数,记得操作前请记得备份相关文件
#
cat >> /etc/security/limits.conf << EOF
root soft nofile 102400
root hard nofile 102400
EOF

# 检查每台机器当前时间和时区是否一致,若相互之间差别大于3s(考虑批量执行时的时差),建议调整时间。
date -R

# 查看和ntp server的时间差异(需要外网访问,如果内网有ntpd服务器,自行替换域名为该服务的地址)
ntpdate -d cn.pool.ntp.org


#蓝鲸服务器之间会有的 HTTP 请求,如果存在 HTTP 代理,且未能正确代理这些请求,会发生不可预见的错误。
# 检查 http_proxy https_proxy 变量是否设置,若为空可以跳过后面的操作。
echo "$http_proxy" "$https_proxy"

#请检查准备用于部署蓝鲸的 3 台机器的主机名是否相同。如果存在同名请进行修改。
# 修改主机名
hostnamectl set-hostname <新主机名>
# 确认主机名修改成功
hostname


#检查 DNS 配置文件 /etc/resolv.conf 是否被加锁,如有请临时解锁。

# 检查文件属性
lsattr /etc/resolv.conf

# 如有加锁,请临时解锁处理
chattr -i /etc/resolv.conf


#上传并解压压缩包
cd /data
tar xf bkce-src-6.2.1.tgz


#解压各个产品
cd /data/src/; for f in *gz;do tar xf $f; done


#获得三台机子的Mac地址,注意我这里是虚拟机只有一张网卡,所以用以下命令可以直接获取到Mac地址,其他的请自行查询
ip a|grep -aiE link/ether|head -n 1|awk '{print $2}'

#获取到Mac地址后到相关链接去进行证书下载

#解压证书包
install -d -m 755 /data/src/cert
tar xf /data/ssl_certificates.tar.gz -C /data/src/cert/
chmod 644 /data/src/cert/*

#拷贝rpm包文件夹到/opt目录
cp -a /data/src/yum /opt

至此准备阶段完成

智云部署阶段

该阶段注意事项:

  1. 请使用本地环境搭建,也就是说不要使用什么SSH远程连接工具去连接这些设备
  2. 请完完全全根据官方网,或者以下的安装顺序进行安装,不然会触发一些意想不到的,还解决不了的BUG(别问我怎么知道的.jpg)
    3.以下全部操作均在中控机执行即可
**以下全部操作均在中控机执行**

# 请根据实际机器的 IP 进行替换第一列的示例 IP 地址,确保三个 IP 之间能互相通信
# 为了防止兼容性的问题,请按照以下官方顺序进行组件分配,IP可以进行更改
# 写入组件安装位置,请不要随便更改,因为该版本有兼容性问题
cat << EOF >/data/install/install.config
[basic]
192.168.107.74 iam,ssm,usermgr,gse,redis,consul,es7,apigw
192.168.107.75 consul,mongodb,rabbitmq,appo,iam_search_engine,redis_cluster
192.168.107.76 paas,cmdb,job,mysql,nginx,zk(config),appt,consul,nodeman(nodeman),auth,etcd
EOF



#执行免密登录创建证书
cd /data/install
bash /data/install/configure_ssh_without_pass



#部署前自定义域名以及安装目录
$BK_DOMAIN:需要更新的根域名。
$INSTALL_PATH:自定义安装目录。

# 执行前请使用实际的二级域名 (如:bktencent.com) 和安装目录进行替换
# 你高兴怎么改都可以,比如说test.local都可以,反正就是配个域名,而且注意这个智云只能通过域名去访问
BK_DOMAIN=bktencent.com
INSTALL_PATH=/data/bkce

cd /data/install 
./configure -d $BK_DOMAIN -p $INSTALL_PATH



#自定义Admin密码,默认为:BlueKing@2023 
cat > /data/install/bin/03-userdef/usermgr.env << EOF
BK_PAAS_ADMIN_PASSWORD=BlueKing@2023 
EOF



# 初始化环境 这个可以检测你的yum是否正确等等还会安装一大堆奇奇怪怪的东西就是了
./bk_install common

# 校验环境和部署的配置
./health_check/check_bk_controller.sh



# 安装 PaaS 平台及其依赖服务
./bk_install paas


# 部署 SaaS 运行环境,正式环境及测试环境
./bk_install app_mgr


#部署API网关
./bk_install apigw


# 部署权限中心
./bk_install saas-o bk_iam
# 部署用户管理
./bk_install saas-o bk_user_manage



#部署 bkiam_search_engine
./bk_install bkiam_search_engine


#部署 paas_plugin
./bk_install paas_plugin



#部署 CMDB 安装配置平台及其依赖服务
./bk_install cmdb



#部署 JOB
# 安装作业平台后台模块及其依赖组件
./bk_install job


#部署bknodeman
./bk_install bknodeman

#部署标准运维及流程服务
#依次执行下列命令部署相关 SaaS
#也可以直接安装全部,但是可能会出错

./bk_install saas-o

# 标准运维
./bk_install saas-o bk_sops

# 流程管理
./bk_install saas-o bk_itsm

#其实没安装完全部的组件,还有很多组件的只不过不知道为什么官方网没有说明,可能是即将下线了

初始化平台和拓展API安装以及平台访问设置

#加载蓝鲸相关维护命令
source ~/.bashrc


#初始化蓝鲸业务拓扑
./bkcli initdata topo


部署 API 自动化测试工具 (可选)
同步安装目录文件到指定机器

./bkcli sync bkapi
部署 API 自动化测试工具

./bkcli install bkapi
运行 API 自动化测试工具

# 默认检查所有模块的 API
./bkcli check bkapi
如何检查单模块 API

目前支持的模块 bk_cmdb, bk_job, bk_gse, bk_itsm, bk_monitorv3, bk_paas, bk_sops, bk_user_manage

# 以 JOB 为例
# 执行完成后,如果需要查看单模块的 API 报告,可以在主域名后面加上模块名称,如 bkapi_check.bktencent.com/bk_job
./bkcli check bkapi bk_job



3.1 配置平台访问
查询模块所分布在机器的方式:

如果 nginx/nodeman 不在同一机器上,请将 nodeman 的域名单独解析至对应的机器上
grep -E "nginx|nodeman" /data/install/install.config


下面介绍的操作均可能覆盖现有 hosts ,进行操作前请先确认是否需要备份
写入hosts文件访问蓝鲸平台
192.168.107.76 paas.bktencent.com cmdb.bktencent.com job.bktencent.com jobapi.bktencent.com bkapi_check.bktencent.com apigw.bktencent.com bkapi.bktencent.com nodeman.bktencent.com

除了编写hosts文件解析以外,可以搭配自身企业的DNS服务器,将该域命解析至该IP,但是值得注意的是在该平台中
有个域名不符合域名解析规范(bkapi_check.bktencent.com ),所以说请先查询自身企业DNS平台是否支持解析


获取管理员账户名密码
在任意一台机器上,执行以下命令,获取管理员账号和密码。

grep -E "BK_PAAS_ADMIN_USERNAME|BK_PAAS_ADMIN_PASSWORD" /data/install/bin/04-final/usermgr.env

常见问题与解决方式

1.Api网关提示连接错误,导致API网关系统部署失败

解决方式:
netstat -ano|grep 10000
检查10000-10010接口是否被占用,如果端口被占用请将进程kill

2.常见的错误解决方式:

/etc/resolv.conf
检查以上文件的首行中是否存在nameserver 127.0.0.1 如果没有,就手动添加上

posted @ 2024-03-09 19:57  枫叶天凝  阅读(290)  评论(0)    收藏  举报