필요한 모든 그래픽과 연결된 pdf/zip 파일이 포함된 html 페이지를 다운로드하세요.

필요한 모든 그래픽과 연결된 pdf/zip 파일이 포함된 html 페이지를 다운로드하세요.

보다 정확하게는 로컬에서 보기 위해 URL에서 웹사이트를 다운로드하고 싶습니다.

  • 다운로드싱글html 페이지(다른 링크가 없는 html 페이지) 및 이를 표시하는 데 필요한 모든 것(CSS, 이미지 등)
  • pdf또한 및 유형의 모든 직접 링크 파일을 다운로드합니다 zip.
  • 그리고 로컬에서 제대로 작동하도록 모든 링크를 수정하세요.
  • 다른 링크(예: HTML 파일)는 변경되지 않은 상태로 유지되어야 합니다.

나는 모든 Linux 기반 도구( macports지원이 좋을 것임) 에 열려 있지만 wget지금까지는 사용이 효과가 없었습니다.

편집하다: wget -E -H -k -K -p내가 원하는 것에 가깝지만 pdf 및 zip 파일을 포함하는 방법은 무엇입니까? (원천: 스택 오버플로)

답변1

HT트랙(홈페이지)는 오프라인 보기를 위해 사이트를 미러링할 수 있으며 다운로드할 항목과 다운로드하지 않을 항목에 대한 상당히 세부적인 옵션을 제공할 수 있습니다. 또한 중단된 다운로드를 재개할 수도 있습니다.

답변2

노력하다:

wget -r -k -l 1 --mirror yourSITE

-r이유 --mirror:

-r: cuused는 wget재귀적으로 작동합니다.

--mirror: 그 이유는 미러 사이트와 같이 wget에게 하라고 지시하는 것입니다. 때로는 시간이 걸립니다.

-k : 단일 문서

-l 1: 레벨 1, 한 레벨의 재귀.

답변3

wget -rk -l 1 <sitename>이것 이나 비슷한 것을 시도해 보셨나요 ? 링크를 상대 경로로 변환하는 동안 콘텐츠를 재귀적으로 가져와야 합니다. 최종 결과는 원하는 것보다 더 많은 .html 파일이 될 수 있지만 index.html을 제외한 모든 파일을 삭제하면 정상적으로 탐색할 수 있습니다.

관련 정보