evince 문서 뷰어를 사용하여 텍스트가 포함된 PDF 이미지를 볼 수 있지만 복사하여 붙여넣을 이미지의 텍스트를 선택할 수 없습니다. PDF 파일의 이미지에서 텍스트를 복사하는 방법은 무엇입니까?
답변1
당신은해야합니다OCR (Optical Character Recognition)
이미지에서 텍스트를 추출하는 기능. 만약 너라면Google OCR
온라인에서 많이 찾을 수 있을 거예요OCR software
이미지에서 텍스트를 추출해 보세요. 나는 개인적으로 얼마나 성공적인지 말하기 어려운 제품을 사용해 본 적이 없습니다. 그 중 일부는 이미지 파일을 입력으로 사용하며, 이 경우 PDF
이미지 형식으로 변환해야 합니다(이를 위한 도구는 온라인에서도 사용 가능).
기술적으로 좀 더 관심이 있다면 여기 Python
라이브러리 가 있습니다.pytesser
이것이 도움이 될 수 있습니다.
Capture2Text
는 OCR을 수행 screenshot
하고 결과를 클립보드에 출력하는 오픈 소스 도구이므로 이미지에서 텍스트를 복사하는 것과 같은 느낌을 줍니다. 이것이 최선의 선택일 수 있습니다.
답변2
Harvinder가 제안한 대로 작동하는 일종의 OCR을 얻을 수 없다면 운이 없는 것입니다. PDF의 이미지인 경우 JPEG, PNG 또는 기타 이미지의 이미지와 다르지 않습니다.
자신에게 맞는 OCR 패키지를 찾더라도 결과가 매우 좋지 않을 수 있습니다. 저는 텍스트를 다시 입력하는 것보다 OCR PDF를 편집하는 데 더 많은 시간을 보냅니다.