wget
모든 자산, 필수 요소가 포함된 전체 웹 페이지를 다운로드하고 나중에 사용할 수 있도록 사용자 정의 폴더에 저장하는 명령을 사용하고 있습니다 .
내 실제 코드:
$ wget --adjust-extension --span-hosts --convert-links --page-requisites \
--no-directories --restrict-file-names=windows --no-parent \
--user-agent="Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.6"\
‐‐execute robots=off --limit-rate 400k --directory-prefix=elbache \
‐‐output-document=index.html http://www.bachecubano.com/celulares
이제 모든 것이 괜찮지만 CSS와 이미지만 줄이고 싶습니다 --page-requisites
(.JS 파일은 필요하지 않습니다). .js 리소스를 로드하지 않으면 다운로드한 페이지가 거의 40% 감소하는데 이는 내 목적에 필요하지 않습니다.
wget
수락만 구성하는 방법.css 및 /images하지만 *.js 파일은 아닌가요?
답변1
wget
매뉴얼 페이지 에서 :
-A acclist --accept acclist
-R rejlist --reject rejlist
Specify comma-separated lists of file name suffixes or patterns to
accept or reject. Note that if any of the wildcard characters,
*, ?, [ or ], appear in an element of acclist or rejlist, it will be
treated as a pattern, rather than a suffix.
따라서 이미 가지고 있는 스위치에 다음 스위치를 추가할 수 있습니다.
-A css,png,jpg,gif,jpeg
노트:당신은 그것을 사용하고 특정 사이트가 어떤 이미지 형식을 사용하는지 알아내야 합니다.