HTML 기반 문서의 디렉토리를 탐색하고 텍스트 또는 PDF로 변환합니다.

Question 1

(find /usr/share/doc/rsyslog-5.8.10/ -type f -name \*.html -exec w3m -dump {} \; ) > /path/to/mydocs.txt

파일이 나열되는 순서가 find조직의 기본 설정에 맞는 경우 이를 사용하여 w3m(콘솔 HTTP 클라이언트) HTML을 렌더링하고 이를 모두 단일 파일로 집계할 수 있습니다.

순서가 마음에 들지 않으면 인수를 우회하여 -exec파일 목록을 얻은 다음 결과 및 정렬된 목록을 씹기 전에 재정렬 할 수 있습니다 w3m.

Answer

(find /usr/share/doc/rsyslog-5.8.10/ -type f -name \*.html -exec w3m -dump {} \; ) > /path/to/mydocs.txt

파일이 나열되는 순서가 find조직의 기본 설정에 맞는 경우 이를 사용하여 w3m(콘솔 HTTP 클라이언트) HTML을 렌더링하고 이를 모두 단일 파일로 집계할 수 있습니다.

순서가 마음에 들지 않으면 인수를 우회하여 -exec파일 목록을 얻은 다음 결과 및 정렬된 목록을 씹기 전에 재정렬 할 수 있습니다 w3m.

Question 2

w3m내 시스템에서 이전 답변을 찾지 못했으므로 다음 을 설치 html2text하고 실행하겠습니다.

find /usr/share/doc/rsyslog-5.8.10/ -type f -name \*.html -exec html2text {} >> all_docs.txt \;

Answer

w3m내 시스템에서 이전 답변을 찾지 못했으므로 다음 을 설치 html2text하고 실행하겠습니다.

find /usr/share/doc/rsyslog-5.8.10/ -type f -name \*.html -exec html2text {} >> all_docs.txt \;

Question 3

올바른 순서로 가져오려면 디렉토리를 확인하고 개별 부분/챕터 순서대로 파일 목록을 생성해야 합니다. $HTMLLIST 목록이 있으면 사용할 수 있습니다.wkhtmlPDF 생성:

wkhtmltopdf --enable-local-file-access index.html "$HTMLLIST" rsyslog.doc.pdf

다음 버전 중 하나를 사용하고 있는지 확인하세요.여기에 게시하세요, 저장소에 있는 저장소는 일반적으로 단일 HTML만 처리할 수 있기 때문입니다.

Answer

올바른 순서로 가져오려면 디렉토리를 확인하고 개별 부분/챕터 순서대로 파일 목록을 생성해야 합니다. $HTMLLIST 목록이 있으면 사용할 수 있습니다.wkhtmlPDF 생성:

wkhtmltopdf --enable-local-file-access index.html "$HTMLLIST" rsyslog.doc.pdf

다음 버전 중 하나를 사용하고 있는지 확인하세요.여기에 게시하세요, 저장소에 있는 저장소는 일반적으로 단일 HTML만 처리할 수 있기 때문입니다.

관련 정보