오프라인으로 탐색할 수 있도록 웹사이트를 다운로드하려고 하는데 html, 이미지, css, javascript 등이 필요합니다.
문제는 이미지가 모두 웹사이트와 동일한 도메인에서 호스팅되지 않으며 CSS 및 JavaScript도 호스팅되지 않는다는 것입니다. 일부 이미지는 imgur에서 가져온 것이고 다른 이미지는 다른 파일 공유 사이트에서 가져온 것입니다. 즉, 이 사이트에서 사용하는 리소스를 보유하는 도메인이 많이 있습니다.
단일 도메인에서 html을 다운로드하면서 해당 html이 사용하는 리소스를 모든 도메인에서 얻으려면 어떻게 해야 합니까?
답변1
매개변수 세트를 사용해야 합니다.호스트 스패닝:
주로:
-H
지정된 호스트가 아닌 다른 호스트로 이동-D
포함할 도메인 지정--exclude-domains
제외할 도메인 지정
예를 들어:
wget -rH --exclude-domains flickr.com myownsite.com