博客
关于我
kubeadm证书/etcd证书过期处理
阅读量:817 次
发布时间:2019-03-24

本文共 1910 字,大约阅读时间需要 6 分钟。

今天突然测试环境的Kubernetes 持续集成/持续发布出了问题了,然后上测试环境服务器排查,发现kubectl指令执行出现问题,提示证书过期。错误信息显示为:Unable to connect to the server: x509: certificate has expired or is not yet valid。详细分析发现,这个问题源于Kubernetes API服务器与Kubelet服务之间的通信中,证书验证功能未能及时更新。

为了解决这个问题,进行了以下操作:

  • 备份现有配置文件和证书

    • 使用cp -rf命令将/etc/kubernetes目录复制到/etc/kubernetes_bak
    • 删除了/etc/kubernetes/pki/apiserver.*front-proxy-client.*以及相关的配置文件(如admin.confkubelet.conf等),以确保旧的证书文件不再影响新的部署。
  • 生成新的证书和配置文件

    • Within the Kubernetes configuration directory, executed the following commands:
      cd ~/kuberneteskubeadm alpha phase certs apiserver-kubelet-clientkubeadm alpha phase certs front-proxy-clientkubeadm alpha phase kubeconfig all --config config.yaml
    • 这些命令生成了新的API服务器、Kubelet客户端和前方代理客户端证书,同时更新了相关的配置文件。
  • 重启相关服务

    • Restarted kubelet和docker服务分别使用以下命令:
      systemctl restart kubeletsystemctl restart docker
    • For clusters with multiple master nodes, repeat this process on each master node, copying the new certificates and configuration files as needed.
  • 验证和测试

    • 使用openssl命令检查了新生成证书的有效日期,并确保它们的有效期超过当前时间。-重新运行了kubectl get node -o wide,观察到节点状态显示为“Ready”,表明集群服务已正常恢复。
  • 除了解决API服务器和Kubelet证书过期问题,ETCD集群的证书也需要及时更新。采取的解决步骤类似于Kubernetes集群的处理:

  • 备份ETCD数据

    • 使用tar命令备份了/var/lib/etcd/目录:
      cd /var/libtar -zvcf etcd.tar.gz etcd/
  • 重新生成ETCD证书

    • 在根目录下的SSL配置文件下,使用cfssl gencert工具生成新的ETCD证书和密钥文件:
      rm -rf /etc/etcd/ssl/*cd /root/sslcfssl gencert -initca ca-csr.json | cfssljson -bare ca ca.pem ca-key.pem -config ca-config.json -profile kubernetes-Soulmatecfssljson -bare etcd-cert etcd.pem etcd-key.pem -config etcd-config.json -profile kubernetes-Soulmatescp -r /etc/etcd/ssl/*.pem node02:/etc/etcd/ssl/scp -r /etc/etcd/ssl/*.pem node03:/etc/etcd/ssl/
  • 验证ETCD证书

    • 使用openssl确认新生成证书的有效日期,并确保它们仍在有效期内:
      [root@node01 ssl]# openssl x509 -in etcd.pem -noout -text | grep 'Not'Not Before: Oct  8 13:49:00 2020 GMTNot After : Oct  8 13:49:00 2021 GMT
  • 通过以上步骤,成功避免了由于证书过期导致的服务中断问题。这一过程遵循了Kubernetes官方推荐的证书管理流程,即定期生成和部署新的证书,以确保集群的安全运行。

    转载地址:http://qkgkk.baihongyu.com/

    你可能感兴趣的文章
    npm install 报错 Failed to connect to github.com port 443 的解决方法
    查看>>
    npm install 报错 fatal: unable to connect to github.com 的解决方法
    查看>>
    npm install 报错 no such file or directory 的解决方法
    查看>>
    npm install 权限问题
    查看>>
    npm install报错,证书验证失败unable to get local issuer certificate
    查看>>
    npm install无法生成node_modules的解决方法
    查看>>
    npm install的--save和--save-dev使用说明
    查看>>
    npm node pm2相关问题
    查看>>
    npm run build 失败Compiler server unexpectedly exited with code: null and signal: SIGBUS
    查看>>
    npm run build报Cannot find module错误的解决方法
    查看>>
    npm run build部署到云服务器中的Nginx(图文配置)
    查看>>
    npm run dev 和npm dev、npm run start和npm start、npm run serve和npm serve等的区别
    查看>>
    npm run dev 报错PS ‘vite‘ 不是内部或外部命令,也不是可运行的程序或批处理文件。
    查看>>
    npm scripts 使用指南
    查看>>
    npm should be run outside of the node repl, in your normal shell
    查看>>
    npm start运行了什么
    查看>>
    npm WARN deprecated core-js@2.6.12 core-js@<3.3 is no longer maintained and not recommended for usa
    查看>>
    npm 下载依赖慢的解决方案(亲测有效)
    查看>>
    npm 安装依赖过程中报错:Error: Can‘t find Python executable “python“, you can set the PYTHON env variable
    查看>>
    npm.taobao.org 淘宝 npm 镜像证书过期?这样解决!
    查看>>