pdftotext
Poppler에는 PDF 파일을 텍스트 파일로 변환하는 훌륭한 도구가 있습니다.
pdftotext input.pdf output.txt
이 텍스트 파일을 pdf로 다시 변환할 수 있는 방법이 있습니까?
변환이란 원본 PDF 파일과 페이지 내용이 유사한 PDF 파일을 얻는 것을 의미합니다.
가능하다면 페이지 번호는 원본 페이지 번호와 동일해야 합니다. 단, 필수 사항은 아닙니다. 페이지 번호가 없는 PDF도 허용됩니다.
정확한 모습은 중요하지 않습니다.
몇 가지 잠재적인 사용 사례 시나리오:
- 실수로 pdf 파일을 삭제했지만 pdftotext에서 텍스트 파일을 다시 받았습니다.
- 텍스트 편집기를 통해 텍스트 파일을 편집하고 PDF 파일의 업데이트된 버전을 생성하려고 합니다.
- 더 작은 크기의 PDF 파일을 생성합니다.
답변1
많은 옵션이 있습니다. 이론적으로 일반 텍스트를 읽고 인쇄할 수 있는 모든 프로그램은 PDF를 생성하는 가상 프린터로 인쇄할 수 있습니다.
하지만 프로그래밍 방식으로 이 작업을 수행한다면 아마도 다음을 사용할 것입니다.판독:
pandoc filename.txt -o output.pdf
기본적으로 pdflatex는 PDF를 생성하는 데 사용되지만 TeX 배포판처럼 무거운 것을 설치하고 싶지 않다면 다음과 같은 다른 백엔드를 사용할 수 있습니다.웨이이 인쇄또는wkhtml을 pdf로:
pandoc --pdf-engine weasyprint filename.txt -o output.pdf
그러나 물론 이미 지적했듯이 결과는 원본 콘텐츠의 형식, 글꼴 등을 유지하지 않습니다.
답변2
프로그램과 비슷하다a2psBash 기능을 사용합니다 a2pdf
.
a2pdf ()
{
lowriter --headless --convert-to pdf "$1"
}
아시다시피 pdftotext를 사용하면 글꼴, 서식, 링크와 같은 PDF의 모든 속성이 손실됩니다.