스캔한 PDF 파일이 있습니다.
일부 페이지는 올바르게 정렬되지 않았으며 분명히 90도 미만의 약간의 회전이 필요합니다. 페이지의 텍스트에 대해 잘 정의된 제한은 없지만 마커 역할을 할 수 있는 수직 또는 수평 장식 선이 있습니다.
페이지를 하나씩 고정하거나 선을 그리거나 광학 방향을 정의하는 등의 솔루션이 있습니까?
답변1
일부 PDF 처리 프로그램에는 파일을 처리할 때 파일의 기울기를 자동으로 조정하는 옵션이 있습니다.
일반적으로 프로세스는 PDF를 페이지당 하나의 이미지 파일로 분할하고 각 이미지의 기울기를 조정한 다음 모든 페이지를 다시 새 PDF 파일로 병합하는 것입니다.
이 분할/오프셋 수정/병합 프로세스를 자동화할 수 있는 프로그램이 있습니다.Ocrmypdf, 아직 텍스트 레이어가 없는 PDF에 텍스트 레이어를 추가할 수 있습니다(또는 기존 텍스트 레이어를 새 레이어로 교체). --deskew
사용하기 전에 각 페이지에 대해 이 작업을 수행할 수 있는 옵션이 있습니다.tesseract-ocr텍스트를 생성합니다.