Centos 7에서 손실된 nfsroot 연결을 디버깅하는 방법은 무엇입니까? ("120초 이상 작업이 차단되었습니다" 참조)

Centos 7에서 손실된 nfsroot 연결을 디버깅하는 방법은 무엇입니까? ("120초 이상 작업이 차단되었습니다" 참조)

디스크가 없는 클라이언트가 부팅 후 24시간 이내에 nfsroot 서버에 대한 연결이 끊어지는 상황이 있습니다. 처음에는 Centos6에서 Centos7로 16개의 블레이드를 동시에 업그레이드하고(nfsroot 디스크 없는/pxe 부팅 사용) 제대로 부팅하고 12시간 이상 실행한 후 모두 동시에 연결이 끊어졌기 때문에 이것이 하드웨어와 관련된 것이라고 생각했습니다. 이렇게 하면 모두 콘솔에 "120초 이상 동안 차단된 작업"이 인쇄됩니다. 블레이드 중 하나를 로컬 디스크에서 부팅하도록 설정했는데, 문제를 재현하는 동안 디스크 없는 블레이드 15개는 설명한 대로 실패했지만 부팅 디스크가 있는 블레이드는 이전처럼 계속 실행되었습니다. nfs 서버는 계속해서 다른 클라이언트에 잘 서비스를 제공합니다.

디스크가 없는 블레이드(M1000e 섀시의 Dell M620)에서 nfsroot 연결이 끊어졌다는 결론에 도달했습니다. 메시지 파일의 양쪽 끝에 흥미로운 내용이 기록되지 않습니다. Centos6에서 7로 모든 변경이 이루어졌기 때문에 이것이 하드웨어 문제는 아니라고 생각하지만, 호환성 문제가 있을 수 있다고 생각합니다. 하드웨어는 Centos7을 지원한다고 주장합니다.

nfsroot 연결이 끊어진 이유를 디버그하는 좋은 방법을 제안할 수 있는 사람이 있습니까? 커널=3.10.0-1160.59.1.el7.x86_64

답변1

확인된 해결 방법/해결 방법: nfs 서버와의 연결 끊김을 방지하려면 dhcpd.conf에 다음 줄을 추가하세요.

default-lease-time infinite;
max-lease-time infinite;

버그 보고서에서 제안한대로https://bugzilla.redhat.com/show_bug.cgi?id=1132396

관련 정보