Linux용 편안한 오프라인 음성 인식 소프트웨어가 필요하십니까?

Linux용 편안한 오프라인 음성 인식 소프트웨어가 필요하십니까?

나는 ~을 찾고 있다오프라인Linux용 음성 인식 소프트웨어는 독일어도 처리하며 사용 및 구성이 쉽습니다.

나는 CMU Sphinx와 다른 여러 가지를 시도했지만 모두 한 가지 공통점이 있습니다. 주로 좋은 매뉴얼이 부족하고 개념이 매우 대략적이기 때문에 설치/사용하기가 너무 복잡합니다. "가용성"이라는 용어를 사용합니다).

그렇다면 제한된 시간 내에 설정 및 구성할 수 있고 인식된 명령을 기반으로 스크립트를 실행할 수 있으며 완전히 오프라인으로 작동할 수 있는 음성 인식 소프트웨어가 있습니까? 즉, 음성 분석을 위해 클라우드 서비스나 원격 서버가 필요하지 않습니다. 단어? 나는 또한 작동하고 작동하는 솔루션에 기꺼이 돈을 쓸 것입니다!

모든 팁과 아이디어를 환영합니다!

감사해요!

추신: 나는 이 주제를 알고 있습니다Linux에 유용한 음성 인식 소프트웨어가 있습니까?- 하지만 거기에 제공된 답변은 오프라인 솔루션을 가리키지 않습니다!

답변1

Michael Shelton이 하는 일에 주목할 가치가 있습니다. http://blog.mikeasoft.com/2017/12/30/speech-recognition-mozillas-deepspeech-gstreamer-and-ibus/

경고: 제 생각에는 아직 실용적인 용도는 없습니다. 하지만... 열심히 구성한 끝에 마침내 음성 단어(영어...독일어를 모릅니다)를 인식할 수 있었습니다.

Mike Sheldon은 Mozilla의 DeepSpeech 모델을 사용하고 있는데 정말 좋습니다.

해당 페이지의 댓글(내 100번째 댓글은 음성 인식에 성공했을 때임)은 2018년 7월에 중단된 것 같습니다. 그 사람이 아직도 노력하고 있는지는 모르겠어요.

답변2

노력하다너드 받아쓰기(데모 비디오).

나는 같은 문제에 부딪혔고 결국 내 자신의 도구를 작성하게 되었고, 몇 가지 독선적인 결정이 있었지만 일반적으로 기본적인 받아쓰기 요구에 잘 작동한다는 것을 알았습니다.(우수한 것을 바탕으로VOSK-API).

답변3

최근에 제가 작성한 기사는 이 정보 중 일부에 대해 더 자세히 답변합니다(아래 정보 중 일부는 geb 및 adabru에게 제공됨). 이는 읽고, 북마크하고, 업데이트를 확인하는 데 도움이 될 수 있습니다.Linux의 시선 추적 및 머리 추적 솔루션

Addabru에 따르면 이는 더 효율적이고 설정하기 쉬운 옵션입니다.https://handsfreecoding.org/그리고 내가 온라인에서 만난 다른 많은 사람들:https://talonvoice.com

음성 언어를 분석하기 위해 오프라인으로 작동하는 것으로 보입니다(7. 개인 정보 보호 참조).https://talonvoice.com/EULA.txt

이 글을 쓰는 시점에 월 25달러 베타 버전을 지불하면 Talon의 Vosk 엔진을 사용하여 독일어 지원을 받을 수 있습니다(지원되는 언어는 Vosk 및 Talon 커뮤니티 위키 참조).

https://alphacephei.com/vosk/

https://talon.wiki/speech_engines/

https://talon.wiki/faq/#are-언어s-other-than-english-supported

Talon에는 무료 버전도 있지만 Talon이 모두 오픈 소스는 아니라는 점을 명심하세요.

누멘을 잘 지켜보겠습니다. Vosk를 사용한 무료 오픈소스 소프트웨어이며 독일어를 지원합니다. 주로 키보드 중심 프로그램(일부는 링크에 나열되어 있음)을 사용하는 경우 이는 매우 좋은 선택으로 보입니다.https://git.sr.ht/%7Egeb/numen

귀하의 필요에 맞는 다른 Vosk 프로젝트가 있을 수 있습니다.https://alphacephei.com/vosk/integrations

Talon과 함께 Dragon을 사용할 수 있지만 Dragon은 Windows에 기본적으로 사용됩니다. 내가 아는 한, Windows에서 Linux 가상 머신을 사용하거나 Windows에서 Cygwin을 사용해야 합니다(참조:https://handsfreecoding.org/using-dragon-with-linux). 아마도 여러분이 찾고 있는 것은 아닐 수도 있지만 Dragon은 독일어를 지원합니다. 그리고 Nuance가 Dragon이 오프라인에서 작업하여 음성 단어를 분석할 수 있다고 말한 것을 기억합니다(이것을 다시 확인하겠습니다). 또한 Dragon과 Dragonfly를 사용할 수도 있습니다.https://handsfreecoding.org/. Dragon의 비용은 약 $300-$500입니다(참조:https://talon.wiki/speech_engines/) 이는 독점적입니다. 내 경험에 비추어 볼 때 나는 개인적으로 Dragon을 추천하지 않으며, 첫 번째 고려 사항도 아닙니다.

관련 정보