저는 wget을 사용하여 localhost에 PHP 템플릿 사이트의 HTML 미러를 생성하고 있습니다. 일부 디렉토리가 확장되지 않은 문서로 미러링되는 데 문제가 있습니다.
이 문제의 원인은 무엇입니까?
나는 다음 명령을 사용하고 있습니다 :
$ wget -mk http://www.example.com/
답변1
이 문제의 원인은 무엇입니까?
실제 사이트에서는 항상 확장자가 붙은 문서를 반환하는지 확인하셨나요? 이를 요구하는 프로토콜은 없으며 이를 사용하지 않는 것이 일반적입니다. 문서 유형은 주소의 접미사가 아닌 http 헤더에 의해 결정됩니다. 물론, 파일 브라우저하다문서는 파일 확장자를 사용하여 식별되므로 이는 문제가 될 수 있습니다.
예를 들어 , 이 페이지는 문자 그대로 http://unix.stackexchange.com/questions/124741/wget-corrupted-directories
다음을 사용하여 얻는 wget
다면 다음과 같이 말합니다.wget-corrupted-directories
답변2
--html-extension
깃발이 없습니다 .
대신 다음 구문을 사용하는 것이 좋습니다.
wget \
--recursive \
--no-clobber \
--page-requisites \
--html-extension \
--convert-links \
--restrict-file-names=windows \
--domains website.org \
--no-parent \
www.website.org