wget이 작은 경로 세트만 따르도록 만드는 방법

wget이 작은 경로 세트만 따르도록 만드는 방법

복잡한 상황을 처리하기 위해 wget을 얻으려고합니다. 기본적으로 해당 시스템에 적합한 파일/폴더만 허용하고 싶습니다.

https://example.com/top/a-file
https://example.com/top/a-file.ext
https://example.com/top/nested/directory/one.ext
https://example.com/top/another/nested/dir/two?maybe=paramsToo

나는 다음과 같은 경로를 따르기를 원하지 않습니다.

https://example.com/
https://example.com/a-file
https://example.com/a-file.ext
https://example.com/top/
https://example.com/top/directory/
https://example.com/top/directory/one.ext
https://example.com/top/another/deeply/nested/direct/two?maybe=paramsToo

기본적으로 나는 이것을 처리하기를 원합니다.

/top/:file
/top/nested/directory/:file
/top/another/nested/dir/:file

이러한 특정 경로를 허용하십시오.

또한 이 경로 내에서는 특정 파일(.html, .js, .css 또는 확장자 없음)만 허용하고 싶습니다.

내가 시도한 것은 다음과 같습니다.

wget --no-parent -r -R .zip,.tar,.gz,.jpghttps://example.com/top

이 부분은 다음 경우를 제외하고 작동합니다. 이 페이지가 현재 평가되는 동안:

https://example.com/top/nested/directory/one.ext

...페이지는 여기에 링크되어 있습니다:

https://example.com/top/a-file

...이 --no-parent옵션은 상위 항목으로 올라가는 것을 방지합니다. 내가 원하는 옵션은 --no-parent앞으로 나아가는 것을 허용하지 않지만 /top,현재 평가된 페이지 기준, 말도 안 돼요.

특정 폴더/경로를 제외 하는 방법은 알고 있지만 -X발생할 수 있는 가능한 경로를 모두 알지 못하므로 무엇을 제외해야 할지 모르겠습니다.

그래서 이것을 달성하는 방법이 궁금합니다.

답변1

리디렉션 방법에 따라 다릅니다.https://example.com/top/a-file, 사용해 보셨나요?

    --max-redirect 0

관련 정보