우선, 이곳이 이 질문을 하기에 적합한 장소가 아니라면 사과드립니다만, 다른 곳은 생각이 나지 않습니다(아마 스택 오버플로?).
어쨌든, 나는 내 메모를 처리하기 위해 광학 문자 인식 소프트웨어(OCR)를 찾고 있습니다. 문제는 가끔 중간에 방정식이 있다는 것입니다. 그래서 저는 텍스트와 방정식을 모두 처리할 수 있고 Linux 시스템에서 실행할 수 있는 소프트웨어를 찾고 있었습니다.
궁극적으로 내 목표는 LaTeX 파일을 생성하는 것이므로 출력이 이미 LaTeX에 있는지 여부는 중요하지 않지만 너무 많은 것을 요구할 것 같습니다.
온라인에서 이 작업을 수행하는 항목을 찾을 수 없지만 이는 주로 올바른 검색어를 사용하지 않기 때문이라고 생각합니다(영어는 내 기본 언어가 아닙니다). 내가 찾았어이 문제하지만 그것은 4년 전의 일이고 그 이후로 상황이 변했다고 생각합니다.
노트의 텍스트 부분을 처리할 수 있는 좋은 소프트웨어와 노트의 방정식 부분을 처리할 다른 소프트웨어를 찾을 수 있다면 모두 통합할 수 있습니다.
누구든지 이 작업을 수행하는 방법을 알고 있습니까?
답변1
이것은 Linux에만 국한된 것은 아니지만http://myscript.com/나쁘지 않은 수학 필기 인식 앱이 있습니다. 그러나 OCR에 대해서는 확실하지 않습니다.
답변2
내 의견은 잊어버리세요. 내 경험에 따르면 Linux의 OCR 프로그램(gocr, tesseract, cuneiform, ocrad)은 모두 형편없으며 심지어 스캔한 serif 글꼴에도 마찬가지입니다. 손글씨를 인식하려면 완전히 잊어버릴 수 있습니다.
누군가 내가 틀렸다는 것을 증명하면 정말 기쁠 것입니다.
Finereader(대규모 스캔에서 더 나은 결과를 얻고 더 많은 [바이너리] 형식으로 내보내기 위해 인식하기 어려운 부분에 대한 교육을 허용하기 때문에 좋음) 또는 Acrobat(좋지만 기능적이지는 않지만 단지 바보 같지만 알겠습니다.) 손글씨로는 만족스러운 결과를 얻을 수 없습니다.
게다가 스캔한 책에서도 수학 공식을 식별할 기회가 없습니다.
(일부 태블릿에는 필기인식 기능이 있는 것으로 알고 있는데, 개인적으로 제품명은 잘 모르겠습니다...)
답변3
이 질문은 오래되었지만 여전히 해결책을 찾고 있는 분들을 위해 다음과 같은 웹 앱을 찾았습니다.수학 픽셀. 사용하려면 로그인이 필요하고 브라우저에서 실행되기 때문에 리눅스뿐만 아니라 모든 플랫폼에서 실행됩니다. 이미지를 수학적 형식으로 변환하므로 사진을 찍으려면 최소한 카메라(또는 휴대폰)가 필요합니다.
내 글을 (거의) 인식하는 것 같았기 때문에 그것이 얼마나 잘 작동하는지에 정말 놀랐습니다. 인간조차도 인식에 동의하지 않습니다.