kubeadm部署k8s集群

1.kubeadm工具功能

kubeadm init：初始化一个Master节点
kubeadm join：将工作节点加入集群
kubeadm upgrade：升级K8s版本
kubeadm token：管理 kubeadm join 使用的令牌
kubeadm reset：清空 kubeadm init 或者 kubeadm join 对主机所做的任何更改
kubeadm version：打印 kubeadm 版本
kubeadm alpha：预览可用的新功能

2.准备环境

服务器要求：

建议最小硬件配置：2核CPU、2G内存、20G硬盘
服务器最好可以访问外网，会有从网上拉取镜像需求，如果服务器不能上网，需要提前下载对应镜像并导入节点

软件环境：CentOS7.9_x64 （mini）+Docker 19-ce +Kubernetes 1.21

服务器规划：

master: k8s1 192.168.137.3

node1: k8s2 192.168.137.4 node2: k8s3 192.168.137.5

3.操作系统初始化配置【所有节点】

# 关闭防火墙

systemctl stop firewalld

systemctl disable firewalld

# 关闭selinux

sed -i 's/enforcing/disabled/' /etc/selinux/config  # 永久

setenforce 0  # 临时

# 关闭swap,内存够的情况下关闭，因为比较慢

swapoff -a  # 临时

sed -ri 's/.*swap.*/#&/' /etc/fstab    # 永久

# 根据规划设置主机名

hostnamectl set-hostname <hostname>

# 在master添加hosts

cat >> /etc/hosts << EOF
192.168.137.3 k8s1
192.168.137.4 k8s2
192.168.137.5 k8s3
EOF

# 将桥接的IPv4流量传递到iptables的链,用containerd也需要这个
cat > /etc/sysctl.d/k8s.conf << EOF
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
EOF

sysctl --system  # 生效
# 时间同步
yum install ntpdate -y
ntpdate time.windows.com

4.安装Docker

这里使用Docker作为容器引擎，也可以换成别的，例如containerd

https://www.cnblogs.com/CGCong/p/15595401.html

5. 安装kubeadm，kubelet和kubectl

#添加阿里云YUM-k8s软件源
cat > /etc/yum.repos.d/kubernetes.repo << EOF
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64
enabled=1
gpgcheck=0
repo_gpgcheck=0
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF
#由于版本更新频繁，这里指定版本号部署：
yum install -y kubelet-1.21.0 kubeadm-1.21.0 kubectl-1.21.0
systemctl enable kubelet

UBUNTU

curl -s https://repo.huaweicloud.com/kubernetes/apt/doc/apt-key.gpg | sudo apt-key add -

cat > /etc/apt/sources.list.d/kubernetes.list << EOF
deb https://repo.huaweicloud.com/kubernetes/apt/ kubernetes-xenial main
EOF 
apt-get update
apt-get install kubelet kubeadm kubectl

6. 部署Kubernetes Master

在192.168.137.3（Master）执行。

kubeadm init \
  --apiserver-advertise-address=192.168.137.3 \
  --image-repository registry.aliyuncs.com/google_containers \
  --kubernetes-version v1.21.0 \
  --service-cidr=10.96.0.0/12 \
  --pod-network-cidr=10.244.0.0/16 \
  --ignore-preflight-errors=all

--apiserver-advertise-address 集群通告地址
--image-repository 由于默认拉取镜像地址k8s.gcr.io国内无法访问，这里指定阿里云镜像仓库地址
--kubernetes-version K8s版本，与上面安装的一致
--service-cidr 集群内部虚拟网络，Pod统一访问入口,可以任意定义
--pod-network-cidr Pod网络，与下面部署的CNI网络组件yaml中保持一致,可以任意定义

或者使用配置文件引导：

$vi kubeadm.conf
apiVersion: kubeadm.k8s.io/v1beta2
kind: ClusterConfiguration
kubernetesVersion: v1.21.0
imageRepository: registry.aliyuncs.com/google_containers 
networking:
  podSubnet: 10.244.0.0/16 
  serviceSubnet: 10.96.0.0/12 

$kubeadm init --config kubeadm.conf --ignore-preflight-errors=all

初始化完成后，最后会输出一个join命令，先记住，下面用。

拷贝kubectl使用的连接k8s认证文件到默认路径：

mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

查看工作节点：

kubectl get nodes

NAME                    STATUS     ROLES                  AGE   VERSION

localhost.localdomain   NotReady   control-plane,master   20s   v1.21.0

注：由于网络插件还没有部署，还没有准备就绪 NotReady

参考资料：

https://kubernetes.io/zh/docs/reference/setup-tools/kubeadm/kubeadm-init/#config-file

https://kubernetes.io/docs/setup/production-environment/tools/kubeadm/create-cluster-kubeadm/#initializing-your-control-plane-node

7. 加入Kubernetes Node

在192.168.137.4/5（Node）执行。

向集群添加新节点，执行在kubeadm init输出的kubeadm join命令：

kubeadm join 192.168.137.3:6443 --token ersebm.ef3ratm9r8yh9tjk \
　　--discovery-token-ca-cert-hash sha256:486ae26a8b585ac62b2ca937fc08ca6c4c5bacb2877ff7dabafc6accd764f015

默认token有效期为24小时，当过期之后，该token就不可用了。这时就需要重新创建token，可以直接使用命令快捷生成：

kubeadm token create --print-join-command

参考资料：https://kubernetes.io/docs/reference/setup-tools/kubeadm/kubeadm-join/

8. 部署容器网络（CNI）

Calico是一个纯三层的数据中心网络方案，是目前Kubernetes主流的网络方案。

下载YAML：

wget https://docs.projectcalico.org/manifests/calico.yaml

下载完后还需要修改里面定义Pod网络（CALICO_IPV4POOL_CIDR），与前面kubeadm init的 --pod-network-cidr指定的一样。

修改完后文件后，部署：

　　kubectl apply -f calico.yaml

　　kubectl get pods -n kube-system

等Calico Pod都Running，节点也会准备就绪。

CoreDNS问题处理：

kubectl get pods -n kube-system

NAME                                     READY   STATUS             RESTARTS   AGE

calico-kube-controllers-8db96c76-z7h5p   1/1     Running            0          16m

calico-node-pshdd                        1/1     Running            0          16m

calico-node-vjwlg                        1/1     Running            0          16m

coredns-545d6fc579-5hd9x                 0/1     ImagePullBackOff   0          16m

coredns-545d6fc579-wdbsz                 0/1     ImagePullBackOff   0          16m

在所有节点执行：

docker pull registry.aliyuncs.com/google_containers/coredns:1.8.0

docker tag registry.aliyuncs.com/google_containers/coredns:1.8.0 registry.aliyuncs.com/google_containers/coredns/coredns:v1.8.0

因为拉不下来的路径出错了。阿里云的路径和官方的路径不一样，可以查看：

kubectl describe pod coredns-545d6fc579-5hd9x -n kube-system 拉取的真实路径

过一会儿，CoreDNS Pod会自动恢复正常。

注：以后所有yaml文件都只在Master节点执行。

安装目录：/etc/kubernetes/

组件配置文件目录：/etc/kubernetes/manifests/

参考资料：https://kubernetes.io/docs/setup/production-environment/tools/kubeadm/create-cluster-kubeadm/#pod-network

9. kubernetes-master内部监听,这个问题可忽略

[root@k8s1 home]# kubectl get cs
Warning: v1 ComponentStatus is deprecated in v1.19+
NAME                 STATUS      MESSAGE                                                                                       ERROR
scheduler            Unhealthy   Get "http://127.0.0.1:10251/healthz": dial tcp 127.0.0.1:10251: connect: connection refused   
controller-manager   Unhealthy   Get "http://127.0.0.1:10252/healthz": dial tcp 127.0.0.1:10252: connect: connection refused   
etcd-0               Healthy     {"health":"true"} 
[root@k8s1 home]# cd /etc/kubernetes/manifests/
[root@k8s1 manifests]# ls
etcd.yaml  kube-apiserver.yaml  kube-controller-manager.yaml  kube-scheduler.yaml
#分别注释port=0
[root@k8s1 manifests]# vi kube-controller-manager.yaml 
[root@k8s1 manifests]# vi kube-scheduler.yaml
#一般会自动重启
[root@k8s1 manifests]# kubectl get cs    
Warning: v1 ComponentStatus is deprecated in v1.19+
NAME                 STATUS    MESSAGE             ERROR
scheduler            Healthy   ok                  
controller-manager   Healthy   ok                  
etcd-0               Healthy   {"health":"true"}

10. 测试kubernetes集群

在Kubernetes集群中创建一个pod，验证是否正常运行：

kubectl create deployment nginx --image=nginx

kubectl expose deployment nginx --port=80 --type=NodePort

kubectl get pod,svc

访问地址：http://NodeIP:Port

报错排查：kubectl get pods -n kube-system

kubectl logs <pod-name> -n kube-system

# 显示 Pod 的详细信息, 特别是查看 pod 无法创建的时候的日志

kubectl describe pod <pod-name> -n <ns-name>

11. 部署 Dashboard

Dashboard是官方提供的一个UI，可用于基本管理K8s资源。

wget https://raw.githubusercontent.com/kubernetes/dashboard/v2.0.3/aio/deploy/recommended.yaml

课件中文件名是：kubernetes-dashboard.yaml

默认Dashboard只能集群内部访问，修改Service为NodePort类型，暴露到外部：

vi recommended.yaml
...
kind: Service
apiVersion: v1
metadata:
  labels:
    k8s-app: kubernetes-dashboard
  name: kubernetes-dashboard
  namespace: kubernetes-dashboard
spec:
  ports:
    - port: 443
      targetPort: 8443
      nodePort: 30001
  selector:
    k8s-app: kubernetes-dashboard
  type: NodePort
...

kubectl apply -f recommended.yaml
kubectl get pods -n kubernetes-dashboard

访问地址：https://NodeIP:30001 集群任何有个IP都行

创建service account并绑定默认cluster-admin管理员集群角色：

# 创建用户
kubectl create serviceaccount dashboard-admin -n kube-system
# 用户授权
kubectl create clusterrolebinding dashboard-admin --clusterrole=cluster-admin --serviceaccount=kube-system:dashboard-admin
# 获取用户Token
kubectl describe secrets -n kube-system $(kubectl -n kube-system get secret | awk '/dashboard-admin/{print $1}')

使用输出的token登录Dashboard。

12. 切换容器引擎为Containerd

参考资料：https://kubernetes.io/zh/docs/setup/production-environment/container-runtimes/#containerd

1、配置先决条件,如果是先安装docker再来切换containerd这一步不需要做了

cat <<EOF | sudo tee /etc/modules-load.d/containerd.conf
overlay
br_netfilter
EOF

sudo modprobe overlay
sudo modprobe br_netfilter

#lsmod(英文全拼:list modules)命令用于显示已载入系统的模块
lsmod |grep overlay
lsmod |grep br_netfilter

# 设置必需的 sysctl 参数，这些参数在重新启动后仍然存在,第三步已经设置前2个了
cat <<EOF | sudo tee /etc/sysctl.d/99-kubernetes-cri.conf
net.bridge.bridge-nf-call-iptables  = 1
net.bridge.bridge-nf-call-ip6tables = 1
net.ipv4.ip_forward                 = 1
EOF

sudo sysctl --system

#查看net.ipv4.ip_forward是否开启
cat /proc/sys/net/ipv4/ip_forward

2、安装containerd

yum install -y yum-utils device-mapper-persistent-data lvm2
yum-config-manager \
    --add-repo \
    https://download.docker.com/linux/centos/docker-ce.repo
yum install -y containerd.io

mkdir -p /etc/containerd
#上面的在安装docker的时候也已经安装了
containerd config default > /etc/containerd/config.toml

#如果先安装了docker,需要停掉
systemctl stop docker
systemctl stop docker.socket

#在master查看node
kubectl get node -o wide

3、修改配置文件

pause镜像设置过阿里云镜像仓库地址
cgroups驱动设置为systemd
拉取Docker Hub镜像配置加速地址设置为阿里云镜像仓库地址

vi /etc/containerd/config.toml
   [plugins."io.containerd.grpc.v1.cri"]
      sandbox_image = "registry.aliyuncs.com/google_containers/pause:3.2"  
         ...
         [plugins."io.containerd.grpc.v1.cri".containerd.runtimes.runc.options]
             SystemdCgroup = true
             ...
      [plugins."io.containerd.grpc.v1.cri".registry.mirrors."docker.io"]
          endpoint = ["https://b9pmyelo.mirror.aliyuncs.com"]
          
systemctl restart containerd

4、配置kubelet使用containerd

vi /etc/sysconfig/kubelet 
KUBELET_EXTRA_ARGS=--container-runtime=remote --container-runtime-endpoint=unix:///run/containerd/containerd.sock --cgroup-driver=systemd

systemctl restart kubelet

5、验证

[root@k8s1 containerd]# kubectl get node -o wide
NAME   STATUS   ROLES                  AGE   VERSION   INTERNAL-IP     EXTERNAL-IP   OS-IMAGE                KERNEL-VERSION           CONTAINER-RUNTIME
k8s1   Ready    control-plane,master   24h   v1.21.0   192.168.137.3   <none>        CentOS Linux 7 (Core)   3.10.0-1160.el7.x86_64   docker://20.10.11
k8s2   Ready    <none>                 23h   v1.21.0   192.168.137.4   <none>        CentOS Linux 7 (Core)   3.10.0-1160.el7.x86_64   docker://20.10.11
k8s3   Ready    <none>                 23h   v1.21.0   192.168.137.5   <none>        CentOS Linux 7 (Core)   3.10.0-1160.el7.x86_64   containerd://1.4.12

6、管理容器工具

containerd提供了ctr命令行工具管理容器，但功能比较简单，所以一般会用crictl工具检查和调试容器。

项目地址：https://github.com/kubernetes-sigs/cri-tools/

设置crictl连接containerd：

vi /etc/crictl.yaml
runtime-endpoint: unix:///run/containerd/containerd.sock
image-endpoint: unix:///run/containerd/containerd.sock
timeout: 10
debug: false

13. docker与crictl命令对照表

注：练习完后，建议还切回Docker引擎，就是把kubelet配置参数去掉即可。

posted on 2021-11-29 22:48 聪神carry 阅读(108) 评论(0) 收藏举报