Wget - 특정 URL 문자열이 포함된 이미지 다운로드

Wget - 특정 URL 문자열이 포함된 이미지 다운로드

다음 URL이 포함된 모든 JPEG를 다운로드할 수 있는 Wget 명령이 있습니까?

http://www.sample.com/images/imag/

따라서 해당 특정 URL 아래의 모든 jpeg는 다음과 같이 다운로드됩니다.

JPEG의 명명 규칙이 다른지 여부에 관계없이.

답변1

wget -r -A jpg,jpeg http://www.sample.com/images/imag/

그러면 전체 디렉토리 트리가 생성됩니다. 디렉토리 트리가 필요하지 않으면 다음을 사용하십시오.

wget -r -A jpg,jpeg -nd http://www.sample.com/images/imag

또는 에 연결하고 (예: SSH를 통해) 폴더 를 sample.com찾습니다 ./images/imagls *.jp* > foo.txtwget -i -F foo.txt -B http://www.sample.com/images/imag/foo.jpg

답변2

"얻는" 방법에 따라 다릅니다.http://www.sample.com/images/imag/이미지 목록.

페이지에 HTML 문서의 이미지가 포함된 경우 다음을 시도해 볼 수 있습니다.

wget -nd -p -A jpg,jpeg -e robots=off http://...

어디:

  • -nd: 디렉터리가 없습니다.--no-directories
  • -p: 이미지가 포함되어 있습니다(페이지에 따라 필수).--page-requisites
  • -A: 허용할 파일 이름 접미사 또는 패턴의 쉼표로 구분된 목록입니다.--accept
  • -e: 명령의 일부인 것처럼 명령을 실행합니다..wgetrc.--execute
    • 여기;봇=꺼짐

일부 서버는 압축된 HTML(예: gzip)만 제공합니다. 그런 다음 wget이 이들(AFAIK)의 압축을 풀고 구문 분석하지 않기 때문에 몇 가지 추가 단계를 수행해야 합니다. 상당히 빠르고 고통 없는 해결책은 다음을 사용하는 것입니다.은둔.

설치 후 다음을 수행 wget하여 프록시를 사용하십시오.

export http_proxy="http://localhost:8118"

그런 다음 명령을 다시 실행하십시오.

관련 정보