문자 인식을 위해 tesseract를 사용하면 결과가 예상과 다릅니다(더 나쁨). 나아지는 방법은 무엇입니까?

문자 인식을 위해 tesseract를 사용하면 결과가 예상과 다릅니다(더 나쁨). 나아지는 방법은 무엇입니까?

내 질문에 Linux 부팅의 출력을 추가하고 광학 문자 인식을 시도하기로 결정했습니다. 2022년에는 확실히 괜찮은 오픈 소스 옵션이 있어야 한다고 생각했습니다(오랜 시간 동안 OCR을 시도하지 않았습니다). "좋은 리뷰"에 대한 웹 검색을 통해 찾은 링크입니다 tesseract.https://www.linuxlinks.com/ocrtools/차트에서 두 번째로 좋습니다.https://askubuntu.com/questions/16268/whats-the-best-simplest-ocr-solution

Tesseract는 아마도 가장 정확한 오픈 소스 OCR 엔진일 것입니다.

apt-get을 통해 배포판에서 설치하고 실행했습니다. 제 생각에는 기본적으로 결과가 끔찍했습니다. 왜? 아마 곧 해결될 수도 있지 않을까요? 아니면 해당 작업을 수행할 수 있는 다른 패키지를 제안하십시오. 제가 식별하려는 페이지에는 상당히 쉬운 작업이라고 생각했기 때문에 이미지가 누락되었습니다. 결과는 아래와 같습니다:

편집: 실제로 작은 부분을 처리할 때 결과가 훨씬 더 좋지만 전체를 처리할 때는 그렇지 않습니다. 선을 더 수평으로 만들고 덜 기울게 만드는 것이 많은 도움이 될 수 있다는 것을 알고 있지만 소프트웨어가 완벽하게 정렬되지 않은 텍스트를 잘 인식할 수 있었으면 좋겠습니다.

여기에 이미지 설명을 입력하세요.

oon usb 1-@: |
“3792661 usb 1-8: New USB device found, idVendor=1343, idProduct:

7.983163] usb 1-8: New USB dev bs P luct=5662, bedDevice=16.6?

re eh peeled haibbetaia a

: new high-speed USB device number 5 PhS |
i

Per Samm SCR Can)
t pela ee rcpt PP cay
: 2.998668) usb 1-8: er
t
Ct

작은 부품만 처리하는 경우:

2.837811) usb 1-8: new high-speed USB device number 5 using xhei_hed

2.979266] usb 1-8: New USB device ECU CREME Cnt ttc cain Tt teen Td
7.983163] usb 1-8: New USB device strings: Mfr=1, Product=2, SerialNumbers@

?.9869291 usb 1-8: Product: Integrated Camera

1을 추가하세요:

더 작고 덜 기울어진 그림으로 다시 시도하면 소프트웨어가 타임스탬프를 별도의 열로 처리하고 매뉴얼 페이지 옵션에 이를 조정하는 옵션이 표시되지 않는 것 같습니다.

여기에 이미지 설명을 입력하세요.

f a eg
| 7.849264]
Device= 6.44
f 7 .6492961
| 7.849355]
f 7.849415]
[ 7.849492]
| Van eos
fl 7.861846]
if Va ACB
| 7.864776]
if eel Be
Ha Bs) bs 4
if be A be ge
C ie BD LB
ce B)
te] Bs]
rage
lb eae
8.962076)
ie Ke Lb
9.600567)
9.696957)
9 .6970371

YS SF SS Se

usb 1-8: new high-speed USB device number 4 using xhci_hcd
usb 1-8: New USB device found, idVendor=04f2, idProduct=b449, bed

usb 1-8: New USB device strings: Mfr=3, Product=1, SerialNumber=2
usb 1-8: Product: Integrated Camera

usb 1-8: Manufacturer: Chicony Electronics Co.,Ltd.
usb 1-8: SerialNumber: 6x0001

usb-storage 1-1:1.6: USB Mass Storage device detected

scsi host3:

usb-storage 1-1:1.6

usbcore: registered new interface driver usb-storage
usbcore: registered new interface driver uas

scsi 3:0:6:@: Direct-fAccess General UDisk eg
sd 3:0:0:0: Attached scsi generic sgi type @

eM Pee PM eA PA ed) te) ae
Py Me ee dd

Py ee ee eee dm

sd 3:0:0:0: [sdb] Assuming drive cache: write through

sdb: sdbi sdb2 sdb3

sd 3:0:0:0: [sdb] Attached SCSI removable disk

squashfs: version 4.6 (2609/01/31) Phillip Lougher

Copying live image to RAM...
Ca ewe te Mae

관련 정보