아직 더 남았어질문어떻게 물어보세요~할 수 있게 하다wget을 사용한 gzip 압축 및 많은웹 페이지이 작업을 수행하는 방법을 알려 주지만 그 반대가 필요합니다. 사이트를 로컬로 미러링하려고 하는데 홈 페이지가 gzip으로 압축된 파일로 표시됩니다. 그러면 재귀가 중단되어 전체 사이트를 가져올 수 없습니다.
파일을 압축할 수 있지만 여전히 목화 따기 사이트 전체를 재귀적으로 다운로드할 수는 없습니다.
gzip 압축을 끄거나 방지하는 방법은 무엇입니까?
편집하다:내가 내린 정확한 명령은 다음과 같습니다.
wget --random-wait -r -p -e robots=off -U mozilla http://www.example.com --reject png,jpg,jpeg,gif --progress=dot --wait=7
답변1
오! 나는 그것에 대해 생각했다. 나는 넣었다
header = Accept-Encoding: gzip,deflate
나는 ~/.wgetrc
wget이 네트워크를 통해 데이터가 전달되는 방식에만 영향을 미칠 것이라고 가정하고 얼마 전에는 gzip으로 압축된 데이터를 읽을 수 있을 것이라고는 전혀 생각하지 못했습니다.
돌이켜보면 이는 의미가 있습니다. 이것은 내장 스위치가 아닌 사용을 허용하는 헤더일 뿐입니다 ( wget
브라우저가 전달할 수 있는 헤더 또는 구성하려는 모든 항목을 사용할 수 있으므로). gzip 압축이 자동으로 처리되기를 wget
기대하는 사람이 있나요 ? wget
그렇다면 정말 좋겠지만 그렇다고 가정할 이유가 없습니다.
답변2
지정이 --header='Accept-Encoding: gzip,deflate'
작동하지 않으면 아마도 다음과 같습니다.
wget -O- http://example.com/file.gz | gunzip -c
curl
또는 해당 라이브러리를 사용하여 libz
HTTP( )를 통해 curl -V | grep libz
압축 파일의 압축을 자동으로 풀 수 있습니다. 매개변수 도 있습니다 --compress
.