Wget이나 Curl 또는 기타 도구를 사용하여 포럼 jpeg 이미지 첨부 파일을 다운로드할 수 있는 방법이 있습니까? 포럼의 특정 페이지에서 JPEG 첨부 파일을 다운로드하고 싶습니다. 모든 포럼 첨부 파일을 다운로드하고 싶지 않고 스레드의 페이지와 관련된 첨부 파일을 다운로드하고 싶습니다. 또한 첨부 파일을 한 번에 하나씩 다운로드하고 싶지 않습니다. 포럼의 페이지에 액세스하고 하나의 명령/작업을 사용하여 해당 페이지에 첨부된 모든 이미지를 다운로드할 수 있기를 원합니다.
Firefox 애드온을 사용하여 포럼 첨부 URL을 검색할 수 있나요?모든 링크 복사:
http://forum.sample.com/attachmentshow.php?attachmentid=5332197&d=1391102903
http://forum.sample.com/attachmentshow.php?attachmentid=5332198&d=1391102903
http://forum.sample.com/attachmentshow.php?attachmentid=5332199&d=1391102903
http://forum.sample.com/attachmentshow.php?attachmentid=5683368&d=1407242372
하지만 Wget이나 Curl(또는 다른 도구)에 포럼 페이지의 URL을 제공하면 명령이 자동으로 첨부 파일 URL을 검색하고 이미지를 다운로드할 수 있다면 더 편리할 것입니다.
답변1
URL에 파일 이름 접미사를 반드시 사용하지 않는 이미지나 파일에 대한 링크를 얻으려면 이 --accept-regex
옵션과 함께 wget을 사용하겠습니다. 귀하의 특정 상황에 따라 사용하는 스크립트를 변경했습니다.
wget -nd -r -l 2 --accept-regex '/attachmentshow' www.domain.tld
설명하다:
-nd
재귀적으로 검색할 때 디렉터리 계층이 생성되는 것을 방지하는 디렉터리가 없습니다.-r
재귀 검색 활성화, 참조재귀 다운로드더 알아보기.-l
재귀 최대 깊이 수준을 지정합니다. 이를 특정 의도에 맞게 변경할 수 있습니다.--accept-regex
URL을 허용하는 정규식을 지정하십시오.
또한 이를 사용하여 -A
허용해야 하는 파일 이름 접미사를 지정할 수도 있습니다.재귀적 승인/거부 옵션더 알아보기.
만났을 때로봇.txt-e robots.off
이 옵션을 사용하여 robots.txt 파일을 무시할 수 있습니다 . 먼저 이 옵션과 그 결과에 대해 읽어 보시기 바랍니다.
wget에 대해 더 자세히 읽을 수 있습니다.매뉴얼 페이지.
귀하의 필요에 맞게 예제를 적용하고 문제를 해결할 수 있기를 바랍니다.