웹사이트 콘텐츠를 다운로드할 수 없습니다.

웹사이트 콘텐츠를 다운로드할 수 없습니다.

우분투 13.04를 사용하고 있습니다. 내가 열었다이 웹사이트내 브라우저에서. 웹사이트에서 책 다운로드를 시작하고 같은 페이지에 책 미리보기를 표시합니다.

페이지에 표시된 책을 내 시스템의 하드 드라이브에 다운로드하고 싶습니다. 을 사용하면 wget책이 아닌 페이지만 다운로드됩니다. 이것이 제가 시도하는 명령입니다. 브라우저에서 URL을 연 다음 를 사용하여 명확성을 확인하십시오 wget.

$ wget http://www.amazon.com/gp/reader/0072520426/ref=sib_dp_ptu#reader-link

웹 브라우저를 통해 책을 열면 책이 다운로드되기 시작하고 페이지에 나타납니다. 이 책을 내 하드 드라이브에 어떻게 다운로드하나요? 페이지에도 다운로드 옵션이 없습니다.

답변1

이 책은 개발자 탭(또는 개발자 도구나 소스 페이지, 무엇이라고 부르든)에서 볼 수 있는 일련의 이미지입니다. 모든 이미지를 다운로드하려면 재귀적 방법을 사용해야 할 수도 있습니다(서버에서 허용하는 경우). ).

답변2

나는 보통 사용한다httrack사이트에서 웹 콘텐츠를 다운로드/미러링하는 데 사용됩니다.

$ httrack http://2011.example.com -K -w -O . -%v --robots=0 -c1 %e0

실행한 후에는 로컬 및 탐색 가능한 디렉터리 구조를 얻게 됩니다. 예를 들어:

$ ls -l
total 304
-rw-r--r--  1 saml saml   4243 Aug 17 10:20 backblue.gif
-rw-r--r--  1 saml saml    828 Aug 17 10:20 fade.gif
drwx------  3 saml saml   4096 Aug 17 10:20 hts-cache
-rw-rw-r--  1 saml saml    233 Aug 17 10:20 hts-in_progress.lock
-rw-rw-r--  1 saml saml   1517 Aug 17 10:20 hts-log.txt
-rw-------  1 saml saml 271920 Aug 17 10:22 hts-nohup.out
-rw-r--r--  1 saml saml   5141 Aug 17 10:20 index.html
drwxr-xr-x 10 saml saml   4096 Aug 17 10:21 2011.example.com

다운로드하면 다음 유형의 출력이 표시됩니다.

Bytes saved:    21,89KiB           Links scanned:   12/45 (+4)
Time:   2s                         Files written:   4
Transfer rate:  2,65KiB/s (2,65KiB/s)  Files updated:   1
Active connections:     1          Errors:  7

Current job: parsing HTML file (57%)
 request -  2011.example.com/cgi-bin/hostnames.pl   0B /    8,00KiB

백그라운드에서 실행되거나 일시 중지된 후 다시 시작될 수 있습니다. 이는 그 능력의 빙산의 일각에 불과합니다. 다운로드를 설정하고 다운로드 진행 상황을 모니터링하기 위한 GUI도 있습니다.

에 대해 많은 것이 있습니다httrack웹사이트그리고 구글링했다.

관련 정보