확률 데이터의 OCR 출력

2024-5-19 • tag-icon

OCR을 사용하여 스캔한 다음 TTS 엔진을 통해 텍스트를 실행하여 인쇄된 책을 오디오로 변환하고 싶습니다. 이 책들은 전자책으로는 구할 수 없습니다.

OCR은 특히 오래된 글꼴이 포함된 이미지를 변환할 때 약간의 실수를 할 수 있으므로 엔진이 인식하는 올바른 일치 가능성이나 기타 다양한 가능성을 설명하는 메타데이터로 텍스트에 태그를 지정할 수 있는 OCR 엔진을 찾고 싶습니다. 영역. 예를 들어 음성-텍스트 엔진의 확률 순위를 나타내는 회색 음영으로 각 단어를 강조 표시하는 Google Voice의 음성 메일 텍스트 변환을 참조하세요.

이 서비스를 제공하는 계획을 알고 계십니까?

관련 정보