HTML 기반 문서의 디렉토리를 탐색하고 텍스트 또는 PDF로 변환합니다.

HTML 기반 문서의 디렉토리를 탐색하고 텍스트 또는 PDF로 변환합니다.

표준 시스템 패키지에 대한 문서는 다음에 포함되어 있습니다.

 /usr/share/doc/rsyslog-5.8.10 (distros: RHEL 6/Centos 6)

그러나 그것은 모두 *.html입니다. 모든 파일을 올바른 순서로 살펴보고 단일 PDF 파일 또는 단일 TXT 파일을 생성하여 페이지별로 수동으로 읽을 필요 없이 문서를 인쇄하고 오프라인으로 읽을 수 있도록 하고 싶습니다.

어떻게 해야 하나요?

답변1

(find /usr/share/doc/rsyslog-5.8.10/ -type f -name \*.html -exec w3m -dump {} \; ) > /path/to/mydocs.txt

파일이 나열되는 순서가 find조직의 기본 설정에 맞는 경우 이를 사용하여 w3m(콘솔 HTTP 클라이언트) HTML을 렌더링하고 이를 모두 단일 파일로 집계할 수 있습니다.

순서가 마음에 들지 않으면 인수를 우회하여 -exec파일 목록을 얻은 다음 결과 및 정렬된 목록을 씹기 전에 재정렬 할 수 있습니다 w3m.

답변2

w3m내 시스템에서 이전 답변을 찾지 못했으므로 다음 을 설치 html2text하고 실행하겠습니다.

find /usr/share/doc/rsyslog-5.8.10/ -type f -name \*.html -exec html2text {} >> all_docs.txt \;

답변3

올바른 순서로 가져오려면 디렉토리를 확인하고 개별 부분/챕터 순서대로 파일 목록을 생성해야 합니다. $HTMLLIST 목록이 있으면 사용할 수 있습니다.wkhtmlPDF 생성:

wkhtmltopdf --enable-local-file-access index.html "$HTMLLIST" rsyslog.doc.pdf

다음 버전 중 하나를 사용하고 있는지 확인하세요.여기에 게시하세요, 저장소에 있는 저장소는 일반적으로 단일 HTML만 처리할 수 있기 때문입니다.

관련 정보