wget 재귀 문제

wget 재귀 문제

wget하나의 시작 URL(각 필수 구성 요소 포함)에서 반복적으로 다운로드하고 동일한 작업을 수행하기 위해 다른 경로를 포함할 수 있는 방법이 있습니까 ?

이를 더욱 명확하게 하기 위해 이 파일은 여러 이미지, 스타일시트 등에 index.html연결됩니다 . http://www.domain1.com/path1/index.html이것이 바로 이 -p옵션의 목적입니다. 하지만 index.html링크(물론 전제 조건 포함)도 다운로드하고 싶다면 어떻게 해야 합니까? http://www.domain2.com/path2/site.html두 번째 웹사이트가 site.html다른 웹사이트로 연결되는 경우 해당 웹사이트를 포함해서는 안 됩니다.

옵션을 통해 두 번째 경로를 추가하려고 시도했지만 --accept-regex원하는 동작이 생성되지 않습니다.

답변1

귀하의 예를 사용하여 달성하려는 목표를 달성하기 위해 wget에 대해 몇 가지 다른 제한을 설정할 수 있습니다.

관련 옵션:

-D허용된 도메인의 쉼표로 구분된 목록을 제공할 수 있습니다. 예를 들어 -D domain1.com,domain2.com이렇게 하면 이 두 도메인에서만 파일을 다운로드할 수 있습니다.

-l최대 재귀 깊이를 지정할 수 있습니다. 자신만의 해석을 사용합니다. 예를 들어, -l 1domain1의 index.html이 domain2의 site.html로 연결되는 경우 site.html은 다운로드되지만 site.html은 아무 것에도 연결되지 않습니다. -l제한은 상당히 높지만, 필요한 모든 파일을 얻기 위해 다양한 제한을 사용하여 여러 번 실행할 수 있습니다 wget.

관련 정보