Rsync에 대한 퍼지 기본 선택 최적화

Rsync에 대한 퍼지 기본 선택 최적화

rsync 명령에서 "퍼지 기본 대상 파일 선택 알고리즘"을 구성할 수 있습니까?

--fuzzy로컬 Proxmox 백업을 오프사이트로 전송할 때 대부분 rsync의 매개변수를 사용하여 성공했지만 때로는 (자세한 로깅에서) rsync"퍼지 기반"에 대해 잘못된 기존 대상 파일이 선택되는 것을 볼 수 있습니다.

이는 200GB 파일에서 이러한 실수를 저지를 때 특히 낭비입니다. 올바른 "퍼지 기반"을 선택했다면 전송할 필요가 없었던 대량의 데이터가 전송되기 때문입니다.

전송 시 까다로운 부분은 원본 폴더와 대상 폴더는 매번 동일하지만 원본 폴더의 모든 파일 이름은 전송할 때마다 다르다는 것입니다. 그러나 "이름이 변경된 각 파일의 내용"은 이전에 이름이 지정된 파일과 95% 동일합니다(대상에는 여전히 이전에 전송된 파일이 있음).

다음은 이름이 어떻게 변경되는지에 대한 간단한 예입니다.

# Source Folder's new files (from today's on-site backup):
file100-2019_09-01_12am.log
file100-2019_09-01_12am.lzo
file101-2019_09-01_12am.log
file101-2019_09-01_12am.lzo
file102-2019_09-01_12am.log
file102-2019_09-01_12am.lzo

# Destination-Folder's old files (from yesterday's off-site backup):
file100-2019_08-31_12am.log
file100-2019_08-31_12am.lzo
file101-2019_08-31_12am.log
file101-2019_08-31_12am.lzo
file102-2019_08-31_12am.log
file102-2019_08-31_12am.lzo

대부분의 경우 rsync는 올바른 "퍼지 베이스"를 선택하지만 때로는 잘못된 베이스를 선택하기도 합니다. 선택 오류에 대한 로그 항목은 다음과 같습니다.

fuzzy basis selected for file100-2019_08-31_12am.lzo:
file101-2019_09-01_12am.lzo

보시다시피, "Fuzzy Base"를 rsync선택하십시오 . 그러나 두 파일은 내용 측면에서 공통점이 많지 않으므로 이러한 잘못된 "퍼지 기반" 선택으로 인해 많은 데이터가 전송됩니다. 파일의 올바른 "퍼지 기반" 은 입니다 . 그러면 왜 선택되었습니까 ? 대안을 선택하기 위해 "퍼지 기본 선택"을 어떻게 최적화할 수 있습니까 ?file101...lzofile100...lzofile100-2019_09-01_12am.lzofile100-2019_08-31_12am.lzofile101-2019_08-31_12am.lzofile100-2019_08-31_12am.lzo

내 경우 퍼지 베이스 선택 알고리즘에는 다음과 같은 선택이 필요합니다.기존 대상 파일저것:

  1. 소스 파일과 파일 확장자가 동일해야 합니다.
  2. 소스 파일과 동일한 가장 연속적인 문자로 시작

rsync 명령에서 "퍼지 기본 대상 파일 선택 알고리즘"을 구성할 수 있습니까?

관련 정보