ORed 텍스트를 PDF 파일로 병합하거나 PDF 파일에서 내보내기

Question

아마도 그렇습니다. Hocr2pdf 도구(ExactImage의)를 사용할 수 있지만 확인을 시도하지는 않았습니다.

참고 사항: 검색 가능한 PDF를 만들고 싶다면 gscan2pdf 등과 같이 PDF 입력을 허용하는 더 간단한 GUI 프로그램을 사용할 수 있습니다. 최신 버전의 tesseract를 사용하여 검색 가능한 PDF를 만들 수도 있습니다.

html 파일에서는 xpdf 툴킷의 pdf2html 내보내기를 사용할 수 있지만 결과가 그다지 만족스럽지 않을 것이며 hocr 형식이 아닐 것입니다.

마지막 질문에 대해서는 잘 모르겠습니다. 하지만 텍스트가 OCR 처리된 경우 확실히 더 쉽게 삭제할 수 있습니다. 참고로 djvudigital을 사용하여 pdf에서 HQ djvu를 만들면 djvused를 사용하여 djvulibre에서 텍스트를 쉽게 제거할 수 있습니다.

PDF 파일 편집에 적합한 LibreDraw를 언급하는 것을 잊었습니다. 여기에는 OCRed PDF가 없으므로 그것이 무엇을 제공할지 모르지만 시도해 볼 가치가 있습니다.

Answer 1

아마도 그렇습니다. Hocr2pdf 도구(ExactImage의)를 사용할 수 있지만 확인을 시도하지는 않았습니다.

참고 사항: 검색 가능한 PDF를 만들고 싶다면 gscan2pdf 등과 같이 PDF 입력을 허용하는 더 간단한 GUI 프로그램을 사용할 수 있습니다. 최신 버전의 tesseract를 사용하여 검색 가능한 PDF를 만들 수도 있습니다.

html 파일에서는 xpdf 툴킷의 pdf2html 내보내기를 사용할 수 있지만 결과가 그다지 만족스럽지 않을 것이며 hocr 형식이 아닐 것입니다.

마지막 질문에 대해서는 잘 모르겠습니다. 하지만 텍스트가 OCR 처리된 경우 확실히 더 쉽게 삭제할 수 있습니다. 참고로 djvudigital을 사용하여 pdf에서 HQ djvu를 만들면 djvused를 사용하여 djvulibre에서 텍스트를 쉽게 제거할 수 있습니다.

PDF 파일 편집에 적합한 LibreDraw를 언급하는 것을 잊었습니다. 여기에는 OCRed PDF가 없으므로 그것이 무엇을 제공할지 모르지만 시도해 볼 가치가 있습니다.

ORed 텍스트를 PDF 파일로 병합하거나 PDF 파일에서 내보내기

답변1

관련 정보