OCR 텍스트가 포함된 대용량 문서 스캔이 있습니다.인터넷 아카이브공부하고 싶어. 불행하게도 PDF 페이지는 내 문서 리더(Okular, Evince, Zathura)에서 매우 느리게 렌더링됩니다. 이런 이유로 예전에는 DJVU 파일을 사용했었는데,그만 만들어라어쩔수없이. pdf2djvu
, , 일부 온라인 도구를 사용하여 DJVU로 직접 변환을 시도하고 djvudigital
심지어 JPEG로 변환도 먼저 시도했지만 프로그램이 전경과 배경을 분리하지 못하는 것 같아서 매번 매우 큰 파일을 얻습니다. 몇 가지 질문이 있습니다.
- 인터넷 아카이브 팀은 이전에 어떻게 DJVU를 만들었나요? 프로세스를 복제하거나 근사화할 수 있습니까?
- 두 번째 링크는 느린 PDF 렌더링이 한동안(적어도 Linux에서는) 문제였음을 나타냅니다. 더 빠른 백엔드와 같은 해결 방법이 있습니까? 파일을 선형화하려고 시도했지만 상황이 개선되지 않았습니다.
문제를 테스트하려면 다음을 고려하십시오.이것푸앵카레 전집