wkhtmltopdf를 사용하여 웹사이트를 PDF로 변환

wkhtmltopdf를 사용하여 웹사이트를 PDF로 변환

매뉴얼을 변환하려고 합니다.http://101.wacom.com/UserHelp/en/TOC/CTH-490.htmlPDF로 변환하세요.

Arch Linux에서는 다음을 시도했습니다.

wget --recursive --page-requisites --domains wacom.com  http://101.wacom.com/UserHelp/en/TOC/CTH-490.html
wkhtmltopdf 101.wacom.com/UserHelp/en/TOC/CTH-490.html foo.pdf

또한 wkhtmltopdf다음으로 대체되었습니다.

htmldoc --webpage -f foo.pdf  101.wacom.com/UserHelp/en/TOC/CTH-490.html                               

첫 번째 페이지만 표시됩니다(거의 비어 있음 htmldoc).

wkhtmltopdf는 커뮤니티 저장소에서 버전 0.12.5입니다.
HTMLDOC 버전은 1.9.8입니다.

답변1

이것은 스크립트를 통해 콘텐츠가 로드된 HTML에서 생성된 빈 셸인 동적 페이지입니다. HTML 소스 코드를 보고 그것이 어떻게 작동하는지 이해한다면, 예약된 청크에 따라 정보를 다운로드할 수 있지만 이를 함께 모아야 합니다.

동적 사이트를 크롤링하려고 하면 Python 및 기타 라이브러리가 좋은 후보입니다.

이것답변도움이 될 수도 있습니다.

관련 정보