매뉴얼을 변환하려고 합니다.http://101.wacom.com/UserHelp/en/TOC/CTH-490.htmlPDF로 변환하세요.
Arch Linux에서는 다음을 시도했습니다.
wget --recursive --page-requisites --domains wacom.com http://101.wacom.com/UserHelp/en/TOC/CTH-490.html
wkhtmltopdf 101.wacom.com/UserHelp/en/TOC/CTH-490.html foo.pdf
또한 wkhtmltopdf
다음으로 대체되었습니다.
htmldoc --webpage -f foo.pdf 101.wacom.com/UserHelp/en/TOC/CTH-490.html
첫 번째 페이지만 표시됩니다(거의 비어 있음 htmldoc
).
wkhtmltopdf는 커뮤니티 저장소에서 버전 0.12.5입니다.
HTMLDOC 버전은 1.9.8입니다.
답변1
이것은 스크립트를 통해 콘텐츠가 로드된 HTML에서 생성된 빈 셸인 동적 페이지입니다. HTML 소스 코드를 보고 그것이 어떻게 작동하는지 이해한다면, 예약된 청크에 따라 정보를 다운로드할 수 있지만 이를 함께 모아야 합니다.
동적 사이트를 크롤링하려고 하면 Python 및 기타 라이브러리가 좋은 후보입니다.
이것답변도움이 될 수도 있습니다.