Wget은 이미지를 재귀적으로 다운로드하지 않습니다.

Wget은 이미지를 재귀적으로 다운로드하지 않습니다.

오프라인 탐색을 위해 이 명령을 사용하여 웹 페이지를 5단계로 반복적으로 다운로드합니다.

wget -r -p --convert-links http://www.pythondiario.com

그런데 이미지가 제대로 다운로드가 되지 않습니다.

어떻게 해결할 수 있나요?

답변1

~처럼카츠라 사토댓글에서 언급했듯이 이 페이지의 일부 이미지는 다른 호스트에서 호스팅됩니다. 기본적으로 wget은 호스트 간 링크를 따르지 않습니다(이는 이미지 검색 및 재귀 순회에 적용됩니다).

wget이 크로스 호스트 링크를 따르도록 하려면 이 -H옵션을 전달하십시오. 통과할 호스트를 제한하려면 이 옵션을 전달하는 것이 좋습니다 -D. 그렇지 않으면 링크된 콘텐츠를 대량으로 다운로드할 위험이 있습니다.

wget -r -p --convert-links -H -Dblogspot.com http://www.pythondiario.com

이를 참고 -H하고 -D이미지뿐만 아니라 재귀 순회에도 적용하세요. -R또는 옵션을 추가하여 호스트 간 링크를 추가로 제한 할 수 있습니다 --reject-regex.

바라보다매뉴얼의 "크로스 호스트"자세한 내용은.

관련 정보