나는 뛰고있어wget
이와 같이:
wget --mirror --adjust-extension --convert-links --no-cookies http://tshepang.net -o log-main
다음과 같은 메시지를 많이 받습니다.
Last-modified header missing -- time-stamps turned off.
이는 페이지가 로컬에 있음에도 불구하고 페이지가 계속 다시 다운로드된다는 의미인 것 같습니다.
노트: 미러 명령을 실행할 때마다 기존 파일을 다시 다운로드할 필요가 없도록 하고 싶습니다.
답변1
매개변수를 추가해 보셨나요 -c
?
wget 매뉴얼에서 발췌:
-c --계속
Wget 1.7부터 비어 있지 않은 파일에 -c를 사용하고 서버가 다운로드 계속을 지원하지 않는 경우 Wget은 처음부터 다운로드 시작을 거부하여 기존 콘텐츠를 효과적으로 삭제합니다. 꼭 처음부터 다운로드 받으시려면 이 파일을 삭제해 주세요.
또한 Wget 1.7부터 서버에 있는 파일과 동일한 크기의 파일에 -c를 사용하면 Wget은 파일 다운로드를 거부하고 설명 메시지를 인쇄합니다. 서버의 파일이 로컬 파일보다 작은 경우에도 동일한 현상이 발생합니다(마지막 다운로드 시도 이후 서버에서 변경되었기 때문일 수 있음). "계속"할 필요가 없으므로 다운로드가 발생하지 않습니다.
반면, -c를 사용하면 로컬보다 큰 서버의 모든 파일은 불완전한 다운로드로 간주되어 "(길이(원격) - 길이(로컬))" 바이트만 다운로드되어 파일에 추가됩니다. 로컬 파일의 끝. 어떤 경우에는 이 동작이 바람직할 수 있습니다. 예를 들어 wget -c를 사용하여 데이터 컬렉션이나 로그 파일에 추가된 새 부분만 다운로드할 수 있습니다.
내가 아는 한, 이미 다운로드되고 크기가 같은 파일은 건너뛰어야 합니다.