컬러 배경에 입력된 텍스트를 인식하기 위한 최고의 명령줄 OCR 소프트웨어

컬러 배경에 입력된 텍스트를 인식하기 위한 최고의 명령줄 OCR 소프트웨어

다음과 같은 이미지에서 텍스트를 추출해야 합니다.

샘플 이미지

보시다시피 텍스트는 손으로 직접 쓴 것이 아니라 타이핑한 것입니다. 게다가 배경도 화려하다.

Tesseract OCR을 사용해 보았는데 가끔 작동했지만 특정 입력에서는 끔찍하게 실패했습니다. 위의 예에서는 "Due CoN aicomrBi em Cela RTL"을 생성합니다.

어떤 명령줄 OCR 소프트웨어를 권장합니까? Tesseract가 최선의 선택이라면 Tesseract의 캐릭터를 더 쉽게 식별할 수 있도록 이러한 이미지를 변환할 수 있습니까?

편집하다convert -threshold 55%: @MarcusMüller의 제안에 따라 전경 텍스트와 배경 텍스트를 더 잘 분리하는 작업을 수행했습니다 . 결과 이미지가 훨씬 좋아졌습니다!

이진화된 이미지

아아, Tesseract는 여전히 작동하지 않습니다. 이 새 이미지에서는 "Bim KM ioes Bm Meme e Cera"가 생성됩니다.

따라서 문제는 계속 열려 있습니다.

답변1

고르지 않은 배경에서 OCR 성능이 좋지 않으면 이미지를 전처리하여 전경을 추출하는 경우 도움이 될 수 있습니다.

사용할 수 있는 기술은 다양하다이미지 분할/전경 추출. 문턱에서 잘한 것 같아요! 아마도 이것을 시도해 보거나 더 고급 추출기(예: openCV)를 사용하거나 신경망을 훈련시켜 자동으로 분할을 수행할 수도 있습니다.

또한 OCR은 밝은 배경에 어두운 텍스트를 사용하는 경우 더 잘 작동할 수 있으므로 반전이 필요할 수 있습니다.

관련 정보