rsync
LAN에 있는 두 서버 간에 대규모 작업을 시작하려고 합니다 . 나에게 더 나은가요?푸시한 서버에서 다른 서버로 파일을 전송하거나당기다그들(뒤로)?
하나는 작동하고 다른 하나는 작동하지 않게 만드는 것은 없습니다. 다른 것 대신에 하나를 수행하는 이유(아마도 속도)가 있는지 궁금합니다.
누군가 나에게 다른 것 대신에 한 가지를 해야 할 합당한 이유를 주거나 이유가 없는 사람을 줄 수 있습니까?
답변1
알고리즘이 작동하는 방식은 rsync
다음에서 볼 수 있습니다.여기.
알고리즘은 대상 파일의 일부와 동일한 소스 파일의 일부를 식별하고 이러한 방식으로 일치할 수 없는 부분만 보냅니다. 실제로 알고리즘은 두 파일을 동일한 컴퓨터에 두지 않고도 차이점 집합을 계산할 수 있습니다. 알고리즘은 파일이 유사할 때 가장 잘 작동하지만, 파일이 완전히 다를 때에도 정확하고 합리적으로 효율적으로 작동합니다.
따라서 업로드하든 다운로드하든 알고리즘은 원본 파일과 대상 파일 모두의 체크섬에서 작동하므로 아무런 차이가 없습니다. 따라서 모든 파일이 소스/대상이 될 수 있습니다.
다음에서 더 유용한 정보를 찾았습니다.여기. 일부 발췌 내용은,
RSync는 원격 파일(또는 데이터) 동기화 프로토콜입니다. 두 컴퓨터 간에 파일을 동기화할 수 있습니다. 동기화란 파일의 두 복사본이 모두 동일하다는 것을 의미합니다. 차이점이 있는 경우 RSync는 이를 감지하여 클라이언트나 서버가 파일 복사본을 업데이트하여 복사본이 동일하도록 보낼 수 있도록 합니다.
RSync는 네트워크를 통해 전체 파일을 보내지 않고도 파일을 동기화할 수 있습니다. 물론 구현이 완료되면 파일의 새 데이터를 포함하여 전체 파일 크기의 약 2%만 교환되었습니다. 새로운 데이터는 네트워크를 통해 바이트 단위로 전송되어야 합니다.
RSync의 작동 방식으로 인해 증분 다운로드/업로드 프로토콜로도 사용할 수 있으므로 여러 세션을 통해 파일을 업로드하거나 다운로드할 수 있습니다. 현재 업로드 또는 다운로드가 실패하면 나중에 다시 시작할 수 있습니다.
답변2
프로그램 rsync
은 실제로 원격 서버에서 자체 복사본을 실행합니다. 양쪽 끝에서 실행 되면 rsync
요청된 파일을 전송하는 가장 좋은 방법을 서로 협상합니다. 어느 쪽이 먼저 시작하는지는 중요하지 않다고 생각합니다.
그러나 나는 대개 나에게 가장 가까운 기계에서 전송을 시작합니다. 이렇게 하면 문제가 발생할 경우 파일 전송 진행 상황을 모니터링할 가능성이 더 높아집니다. 두 컴퓨터가 동일한 LAN에 있는 경우 이러한 이유는 다른 컴퓨터보다 한 컴퓨터를 선택하는 이유가 되지 않습니다.
답변3
전송을 사용하는 경우ADSL 회선다운로드할 때와 업로드할 때의 비트 전송률이 다르기 때문입니다. 이 경우 대상 머신의 위치에 따라 선택이 달라집니다.
답변4
공용 서버의 보안 및 백업을 위해서는 데이터 백업 소스에서 가져오는 것이 푸시하는 것보다 나은 경우가 많습니다. 예를 들어, 데이터 소스가 해커 공격으로 인해 손상되면 자격 증명이 백업 서버에 노출됩니다. 또한 (푸시가 아닌) 풀은 각각의 별도 백업 소스에서 백업 서비스를 유지 관리할 필요 없이 백업 프로세스를 백업 서버로 격리합니다. 백업 관리가 더 쉬워질 수 있습니다. 하나의 백업 서버가 여러 소스에서 백업을 가져오고 모든 백업 관리가 하나의 서버에서 수행될 것이라고 상상합니다.
그러나 업무상 중요하지 않은 백업의 경우에는 단순성과 사용 편의성을 추구합니다. 나는 집에서 푸시를 사용하여 rsync(SFTP/SSH를 통해)를 통해 모든 개인 데이터를 백업합니다.