웹사이트에서 재귀적으로 다운로드

웹사이트에서 재귀적으로 다운로드

해당 제품 폴더 내의 웹사이트 URL ""에서 이미지를 가져오려고 하는데 www.example.com/products하위 폴더가 많아 제품 폴더를 다운로드해야 합니다.

www.example.com/products, www.example.com/products/subfolders에서 이미지는 다음과 같습니다.

  • www.example.com/products/subfolder1/image.jpg,
  • www.example.com/products/subfolder2/image.jpg,
  • www.example.com/products/subfolder3/image.jpg

데이터 하위 폴더가 포함된 제품 폴더를 다운로드하는 방법.

답변1

wget -nd -r -l1 -P /save/location -A jpeg,jpg http://www.example.com/products

설명하다:

-nd디렉터리 계층 생성을 방지합니다(예:디렉토리 없음).

-r재귀 검색을 활성화합니다. 바라보다재귀 다운로드더 많은 정보를 알고 싶습니다.

-l1재귀의 최대 깊이 수준을 지정합니다. 1 귀하의 경우 이 디렉토리만 입니다 products.

-P모든 파일과 디렉터리가 저장되는 디렉터리 접두사를 설정합니다.

-A특정 파일 형식만 검색하려면 화이트리스트를 설정하세요. 문자열과 패턴을 허용하며 둘 다 쉼표로 구분된 목록에서 사용할 수 있습니다(위에 표시됨). 바라보다파일 유형더 많은 정보를 알고 싶습니다.

답변2

httrack(1)전체 웹사이트의 로컬 미러를 만드는 데 가장 유용한 웹 스파이더를 사용해 보세요 .

링크된 맨페이지의 예제를 참조하여 시작하세요.

답변3

wget -nH --page-requisites -R -nH -P mirrorDirectory https://example.com

여기서 mirrorDirectory는 출력이 저장될 경로입니다.

관련 정보