apt-get을 사용하여 Tesseract를 설치했지만 실제로 작동하지 않았습니다. 어딘가에서 바이너리를 다운로드하여 디렉토리에 넣고 그런 식으로 사용할 수 있을까요?
지금 내 Tesseract에 무슨 문제가 있나요?
tesseract --help
tesseract:Error:Usage:tesseract imagename outputbase [-l lang] [configfile [[+|-]varfile]...]
그리고
tesseract test.tif out2.txt -l pol
Unable to load unicharset file /usr/share/tesseract-ocr/tessdata/pol.unicharset
위의 디렉토리에 폴란드어를 다운로드하여 압축을 풀었지만 유일한 pol.*는 pol.traineddate입니다.
답변1
귀하의 경우에는 다음을 사용하여 폴란드어 지원도 설치해야 합니다 apt
.
sudo apt install tesseract-ocr-polsudo apt search tesseract-ocr-*
다른 언어의 경우 언어 팩을 나열하고 해당 언어와 일치하는 것을 선택하세요.
sudo apt search tesseract-ocr-*
루마니아어 예:
sudo apt search tesseract-ocr-* | grep "Romanian" -b1
줄게
7900-tesseract-ocr-ron/xenial,xenial 3.04.00-2 all
7946: tesseract-ocr language files for Romanian
7990-
그런 다음
sudo apt install tesseract-ocr-ron