하드코딩된 자막 추출

하드코딩된 자막 추출

OCR을 통해 하드코딩된 자막을 추출할 수 있는 방법이 있는지 알고 싶습니다. 나중에 사용할 수 있도록 프레임을 추출한 후 이미지 처리를 해야 하나요 tesseract?

영상에서 프레임을 추출하고 자막이 아닌 색상 내용을 모두 제거해 보았지만 tesseract나중에 사용할 때 끔찍한 결과를 얻었습니다.

이와 같은 해결 방법만 사용하면 좋은 결과를 얻을 수 있습니까? 아니면 tesseract스스로 훈련해야 합니까? 임의의 영화 사진에 임의의 글꼴이 추가된 임의의 인용문을 사용하여 훈련 데이터를 생성하는 것은 쉽지만 훈련하는 데 많은 시간이 걸립니다.

관련 정보