분명히 파일과 디렉토리의 소멸은 gcc용으로 설치된 바이너리와 같이 일반적으로 "읽기 전용"인 /var 및 /usr과 apt-get, aptitude, 몇 가지 테스트와 수정을 시도했지만 많은 명령과 유틸리티가 더 이상 작동하지 않았고 모두 충돌했으며 일부 종속성 또는 파일이 사라졌습니다.
파일 시스템은 ext4이며 지난 금요일(2015년 11월 13일) 오후 4시 10분(GMT-3 DST, 브라질)경에 이 일이 이상하게 발생했습니다. /var의 일부 로그 파일도 사라졌습니다. 그러나 사용자가 시스템 이상 현상을 발견하면 많은 오류가 표시되기 시작하는 시스템 로그를 얻을 수 있습니다. 그러나 이러한 오류는 파일 누락과만 관련이 있으며 데이터가 사라지거나 모든 종류의 하드 드라이브 문제를 일으킬 수 있는 이벤트를 설명하지 않습니다.
해결 방법으로 복구 이미지로 부팅하여 /home 데이터의 복사본을 가져왔습니다. 이 복사본은 손상되었지만 일부 파일에서 복구할 수 있었습니다. 물론 일부 데이터는 복구되었지만 많은 파일과 디렉터리가 사라졌고, 일부는 여전히 존재했지만 잘렸습니다(크기 0).
이를 설명할 수 있는 몇 가지 알려진 문제가 있습니까? 다른 서버에서 이런 일이 다시 발생하지 않도록 하려면 어떻게 해야 합니까?
첨부된:"Storage"는 하드 디스크 RAID 1(2개의 하드 디스크 사이에 위치)에 설치됩니다.
편집 환경: 기계가 고장 나서 거기에서 많은 정보를 얻을 수 없지만 데비안이 실행되고 있습니다.
uname -a
Linux XXXX 3.16.0-4-amd64 #1 SMP Debian 3.16.7-ckt11-1+deb8u6 (2015-11-09) x86_64 GNU/Linux
- 일부 NAT에서는
- 외부(클라우드) SVN 서버에 대한 인터넷 액세스(방화벽으로 제어됨)
- 수동 업데이트(apt-get 업데이트/업그레이드)를 위해 인터넷을 통해 일부 패키지 저장소에 액세스합니다.몇 달 안에 업데이트나 업그레이드가 없습니다.
- SSH를 통해 액세스
답변1
나는 실제로 당신이 커널 3과 4의 유명한 ext4 손상 버그로 고통받고 있다고 의심합니다. 이 스레드를 살펴보세요.
http://bugzilla.kernel.org/show_bug.cgi?id=89621.
이 오류에 대한 더 많은 스레드가 있는데, 저는 이 스레드가 더 흥미로웠습니다.
다른 서버의 업데이트 및 버전이 동일한 경우 보안/패키지 업데이트를 여러 차례 수행하는 것이 좋습니다.