wget이 재귀 모드에서 작동하지 않습니다

Question 1

aol.com/index.html모든 링크가 다른 호스트를 가리키기 때문에 문제가 발생합니다 . 모든 호스트에서 반복적으로 다운로드하려면 이 옵션을 추가할 수 있습니다 --span-hosts. 모든 AOL 호스트를 허용하려면 옵션을 추가하는 것이 나에게 맞는 것 같았습니다 --span-hosts '*.aol.com'.

wget --span-hosts '*.aol.com' -r http://www.aol.com

링크를 나열할 수 있습니다.

grep -Po '(?<=href=")[^"]*' aol.com/index.html

대부분이 www.aol.com을 가리키는 것을 볼 수 있으므로 전화를 걸어도 됩니다.

wget -r http://www.aol.com

Answer

aol.com/index.html모든 링크가 다른 호스트를 가리키기 때문에 문제가 발생합니다 . 모든 호스트에서 반복적으로 다운로드하려면 이 옵션을 추가할 수 있습니다 --span-hosts. 모든 AOL 호스트를 허용하려면 옵션을 추가하는 것이 나에게 맞는 것 같았습니다 --span-hosts '*.aol.com'.

wget --span-hosts '*.aol.com' -r http://www.aol.com

링크를 나열할 수 있습니다.

grep -Po '(?<=href=")[^"]*' aol.com/index.html

대부분이 www.aol.com을 가리키는 것을 볼 수 있으므로 전화를 걸어도 됩니다.

wget -r http://www.aol.com

Question 2

다음 명령을 사용하면 wget웹사이트에 링크된 모든 페이지를 재귀적으로 다운로드할 수 있습니다.

wget -r $(curl http://aol.com | grep -Po '(?<=href=")[^"]*')

예시 웹사이트를 원하는 웹사이트로 바꾸세요. 이것은 다음과 같습니다Deapth for search in a graph

작업 방식 curl을 얻을 것입니다 . 일치하여 모든 링크를 찾기 위해 index.html파이프됩니다 . 입력 결과는 변수로 제공됩니다. 변수에서 하나씩 링크를 가져옵니다.grephrefwgetwget

Answer

다음 명령을 사용하면 wget웹사이트에 링크된 모든 페이지를 재귀적으로 다운로드할 수 있습니다.

wget -r $(curl http://aol.com | grep -Po '(?<=href=")[^"]*')

예시 웹사이트를 원하는 웹사이트로 바꾸세요. 이것은 다음과 같습니다Deapth for search in a graph

작업 방식 curl을 얻을 것입니다 . 일치하여 모든 링크를 찾기 위해 index.html파이프됩니다 . 입력 결과는 변수로 제공됩니다. 변수에서 하나씩 링크를 가져옵니다.grephrefwgetwget

wget이 재귀 모드에서 작동하지 않습니다

답변1

답변2

관련 정보