![Wget은 이미지를 재귀적으로 다운로드하지 않습니다.](https://linux55.com/image/116836/Wget%EC%9D%80%20%EC%9D%B4%EB%AF%B8%EC%A7%80%EB%A5%BC%20%EC%9E%AC%EA%B7%80%EC%A0%81%EC%9C%BC%EB%A1%9C%20%EB%8B%A4%EC%9A%B4%EB%A1%9C%EB%93%9C%ED%95%98%EC%A7%80%20%EC%95%8A%EC%8A%B5%EB%8B%88%EB%8B%A4..png)
오프라인 탐색을 위해 이 명령을 사용하여 웹 페이지를 5단계로 반복적으로 다운로드합니다.
wget -r -p --convert-links http://www.pythondiario.com
그런데 이미지가 제대로 다운로드가 되지 않습니다.
어떻게 해결할 수 있나요?
답변1
~처럼카츠라 사토댓글에서 언급했듯이 이 페이지의 일부 이미지는 다른 호스트에서 호스팅됩니다. 기본적으로 wget은 호스트 간 링크를 따르지 않습니다(이는 이미지 검색 및 재귀 순회에 적용됩니다).
wget이 크로스 호스트 링크를 따르도록 하려면 이 -H
옵션을 전달하십시오. 통과할 호스트를 제한하려면 이 옵션을 전달하는 것이 좋습니다 -D
. 그렇지 않으면 링크된 콘텐츠를 대량으로 다운로드할 위험이 있습니다.
wget -r -p --convert-links -H -Dblogspot.com http://www.pythondiario.com
이를 참고 -H
하고 -D
이미지뿐만 아니라 재귀 순회에도 적용하세요. -R
또는 옵션을 추가하여 호스트 간 링크를 추가로 제한 할 수 있습니다 --reject-regex
.
바라보다매뉴얼의 "크로스 호스트"자세한 내용은.