문서에 해당하는 일부 페이지를 색인화하려고 합니다.
내 생각엔 이걸 위해서야
wget --no-parent -r -l 5 https://developer.mozilla.org/en-US/docs/Web/JavaScript/
그러나 요청은 이전 URL의 상위 URL로 리디렉션되므로 https://developer.mozilla.org/en-US/docs/Web/JavaScript
다운로드되지 않습니다.
따라서 이 문제를 해결하려면 -I를 사용해야 합니다. 내가 아는 한
wget \
`## Basic Startup Options` \
--execute robots=off \
`## Loggin and Input File Options` \
--output-file=$HOME/wget-last.log \
--debug \
`## Download Options` \
`## Directory Options` \
`## HTTP Options` \
--adjust-extension \
`## HTTPS Options` \
--no-check-certificate \
`## Recursive Retrieval Options` \
--recursive --level=5 \
`## Recursive Accept/Reject Options` \
-I=/en-US/docs/Web/JavaScript,/en-US/docs/Web/JavaScript/* \
https://developer.mozilla.org/en-US/docs/Web/JavaScript
이것으로 이전 사이트의 작업이 완료되었습니다. 그런데 지금은 이런 태그에 갇힌 것 같아요.
<a href="/en-US/docs/Web/JavaScript/Tutorials"><strong>Tutorials</strong></a>
다음 디버그 메시지가 표시됩니다.
Deciding whether to enqueue "https://developer.mozilla.org/en-US/docs/Web/JavaScript/Tutorials".
https://developer.mozilla.org/en-US/docs/Web/JavaScript/Tutorials (en-US/docs/Web/JavaScript) is excluded/not-included.
Decided NOT to load it.
다운로드해야 하는 나머지 파일도 마찬가지입니다.