페이지 요구사항은 있지만 이미지와 CSS만 있는 웹사이트를 다운로드하세요.

페이지 요구사항은 있지만 이미지와 CSS만 있는 웹사이트를 다운로드하세요.

wget모든 자산, 필수 요소가 포함된 전체 웹 페이지를 다운로드하고 나중에 사용할 수 있도록 사용자 정의 폴더에 저장하는 명령을 사용하고 있습니다 .

내 실제 코드:

$ wget --adjust-extension --span-hosts --convert-links --page-requisites \
 --no-directories --restrict-file-names=windows --no-parent \
 --user-agent="Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.6"\
 ‐‐execute robots=off --limit-rate 400k --directory-prefix=elbache \
 ‐‐output-document=index.html http://www.bachecubano.com/celulares

이제 모든 것이 괜찮지만 CSS와 이미지만 줄이고 싶습니다 --page-requisites(.JS 파일은 필요하지 않습니다). .js 리소스를 로드하지 않으면 다운로드한 페이지가 거의 40% 감소하는데 이는 내 목적에 필요하지 않습니다.

wget수락만 구성하는 방법.css 및 /images하지만 *.js 파일은 아닌가요?

답변1

wget매뉴얼 페이지 에서 :

   -A acclist --accept acclist
   -R rejlist --reject rejlist
       Specify comma-separated lists of file name suffixes or patterns to 
       accept or reject. Note that if any of the wildcard characters, 
       *, ?, [ or ], appear in an element of acclist or rejlist, it will be
       treated as a pattern, rather than a suffix.

따라서 이미 가지고 있는 스위치에 다음 스위치를 추가할 수 있습니다.

-A css,png,jpg,gif,jpeg

노트:당신은 그것을 사용하고 특정 사이트가 어떤 이미지 형식을 사용하는지 알아내야 합니다.

관련 정보