wget 미러 사이트 + 다른 도메인의 리소스

wget 미러 사이트 + 다른 도메인의 리소스

오프라인으로 탐색할 수 있도록 웹사이트를 다운로드하려고 하는데 html, 이미지, css, javascript 등이 필요합니다.

문제는 이미지가 모두 웹사이트와 동일한 도메인에서 호스팅되지 않으며 CSS 및 JavaScript도 호스팅되지 않는다는 것입니다. 일부 이미지는 imgur에서 가져온 것이고 다른 이미지는 다른 파일 공유 사이트에서 가져온 것입니다. 즉, 이 사이트에서 사용하는 리소스를 보유하는 도메인이 많이 있습니다.

단일 도메인에서 html을 다운로드하면서 해당 html이 사용하는 리소스를 모든 도메인에서 얻으려면 어떻게 해야 합니까?

답변1

매개변수 세트를 사용해야 합니다.호스트 스패닝:

주로:

  • -H지정된 호스트가 아닌 다른 호스트로 이동
  • -D포함할 도메인 지정
  • --exclude-domains제외할 도메인 지정

예를 들어:

wget -rH --exclude-domains flickr.com myownsite.com

관련 정보