wget 및 재귀적 wget에서 파일 다운로드 방지

wget 및 재귀적 wget에서 파일 다운로드 방지

비슷한 명령을 사용할 수 있지만 wget -m -A.jpg http://www.mysite.tld/모든 파일을 다운로드한 다음 jpg가 아닌 경우 다음과 같이 파일을 삭제합니다.

`HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘index.html’

index.html                             [           <=>                                                     ]   1.73K  --.-KB/s   in 9.5s   

2015-01-13 16:55:52 (186 B/s) - ‘index.html’ saved [1776]

Removing index.html since it should be rejected.`

웹사이트에서 다른 파일을 모두 다운로드하고 나중에 삭제할 필요 없이 .jpg 파일만 다운로드하고 싶습니다. 파일 중 일부는 매우 크고 나머지는 매우 크기 때문입니다.

답변1

이것은 wget에 의해 구문 분석된 링크 트리의 일부입니다. 이는 htm/html에 대해서만 수행됩니다(즉, jpg가 아닌 모든 파일을 다운로드하는 것이 아니라 .htm 또는 .html 파일인 모든 jpg가 아닌 파일만 다운로드합니다). 그것은 기능의 일부여야 합니다. 바라보다,https://www.gnu.org/software/wget/manual/html_node/Types-of-Files.html

참고: 연결하고 명령을 실행하여 파일을 나열하고 출력을 텍스트 파일로 리디렉션할 수 있는 경우 wget이 링크를 통해 다운로드하도록 하는 대신 파일에서 다운로드 URL을 읽을 mysite.tld수 있습니다 .wget -i foo.txt

예: 원격 시스템에서: ls *.jp* > foo.txt그런 다음 로컬 시스템에서: ( 물론 로컬 시스템으로 이동하거나 다른 방법으로 가리켜 wget -i -F foo.txt -B http://www.mysite.tld/foo.jpg야 합니다 )foo.txt

관련 정보