Kubernetes Tiller 포드 사망 문제

Kubernetes Tiller 포드 사망 문제

내 kubernetes는 AWS에서 실행 중이고 템플릿 작성에 helm을 사용합니다. 문제는 tiller pod 클러스터에 로드가 많지 않은 경우에도 몇 시간마다 충돌이 발생한다는 것입니다. 나는 로그에서 아무것도 모른다

ubuntu@kops:~$ kubectl get pods -owide -n kube-system | grep tiller tiller-deploy-6b985bb7b-88ssk 0/1 CrashLoopBackOff 71 19h 100.96.4.3 ip-172-20-46-194.us-west-2.compute.internal ubuntu@kops:~$ ubuntu@kops:~$ ubuntu@kops:~$ kubectl describe pod tiller-deploy-6b985bb7b-88ssk Error from server (NotFound): pods "tiller-deploy-6b985bb7b-88ssk" not found ubuntu@kops:~$ ubuntu@kops:~$ ubuntu@kops:~$ ubuntu@kops:~$ ubuntu@kops:~$ kubectl logs tiller-deploy-6b985bb7b-88ssk Error from server (NotFound): pods "tiller-deploy-6b985bb7b-88ssk" not found ubuntu@kops:~$

사용 가능한 메모리가 많은 EC2에서 실행되고 있으며 CPU는 8코어입니다. admin@ip-172-20-46-194:~$ free -h total used free shared buffers cached Mem: 31G 5.1G 26G 1.1M 1.5G 2.4G -/+ buffers/cache: 1.2G 30G Swap: 0B 0B 0B

top - 03:08:29 up 19:20,  1 user,  load average: 79.51, 78.59, 77.98
Tasks: 176 total,   4 running, 172 sleeping,   0 stopped,   0 zombie
%Cpu(s): 28.2 us,  0.5 sy,  0.1 ni,  0.0 id,  0.0 wa,  0.0 hi,  0.0 si, 71.3 st
KiB Mem:  32950672 total,  5371456 used, 27579216 free,  1524240 buffers
KiB Swap:        0 total,        0 used,        0 free.  2561276 cached Mem

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
12203 root      20   0  906520  16756   1492 S 235.0  0.1   1427:46 docker
23974 root      20   0  906520  16796   1492 S 221.1  0.1   1054:34 docker
24072 root      20   0  906520  16796   1492 S 132.0  0.1 669:17.68 docker
12318 root      20   0  906520  16792   1492 S 130.7  0.1 900:54.95 docker
17543 nobody    20   0  906520  16796   1492 S  29.1  0.1  84:01.18 docker
23865 nobody    20   0  906520  16796   1492 R  15.9  0.1  69:02.31 docker
12112 nobody    20   0  906520  16792   1492 S  14.6  0.1  91:27.51 docker
 3013 root      20   0 6753392 124600  50028 S   7.6  0.4  73:59.01 kubelet
 6378 nobody    20   0  683644 432120  29772 R   6.0  1.3  21:09.54 prometheus

답변1

한 단계 더 나아가려면 --namespace kube-system설명 명령에 다음을 추가해야 합니다.

kubectl --namespace kube-system describe pod tiller-deploy-6b985bb7b-88ssk 

그러면 근본 원인을 더욱 효과적으로 해결할 수 있습니다. 포드를 삭제하여 일시적으로 우회하려는 경우에도 마찬가지입니다.

관련 정보