나는 중복되는 더 긴 로그 파일을 가지고 있는 경우가 많습니다. 중복이란 텍스트 블록이 작은 변경 사항으로 반복되는 경우를 의미합니다. 파일 길이 때문에 실제 정보를 찾기가 어렵습니다. 내 생각은 중복을 식별하고 각 중복을 diff 출력의 연속 블록으로 대체하여 파일을 줄일 수 있는 스크립트를 작성하는 것입니다. 시작하기 전에 그러한 도구(또는 diff 옵션)가 이미 존재하는지 알고 싶습니다.
답변1
비슷한 문제에 대한 Drench 사용자의 접근 방식을 살펴보는 것이 좋습니다. 그는 이 사이트에서 다음과 같이 말했습니다.https://unix.stackexchange.com/a/837/27616(즉, git
.를 사용하면 차이점만 저장하고 시간에 맞춰 모든 버전을 검색하는 등의 작업이 가능합니다. 그는 장점/단점/경고에 대한 추가 정보가 포함된 블로그 링크를 제공합니다.)
답변2
당신은 주로찾다로그 파일에서 필요할 수 있는 정보를 제거하는 것은 좋은 생각이 아닙니다. 즉, 예를 들어 logrotate
일정 기간(예: 매월) 후에 로그 파일을 교체하고 Google에 "유닉스 로그 파일 검색"을 요청하면 약 500만 건의 조회수가 발생하는 도구가 있습니다(예, 이는 일반적인 작업입니다).