X11을 사용하여 음성 인식을 수동으로 시작/종료하는 방법은 무엇입니까?

X11을 사용하여 음성 인식을 수동으로 시작/종료하는 방법은 무엇입니까?

잘 작동하는 음성 인식 소프트웨어를 찾았습니다(참조이 문제),

여전히 통합이 필요하며 제 경우에는 이를 활성화하는 쉬운 방법이 필요합니다.

내가 찾고 있는 결과는 다음과 같습니다.

  • 단축키를 누르면 받아쓰기가 시작됩니다.
  • 받아쓰기를 종료하려면 단축키를 누르세요.
  • 키보드로 입력한 것처럼 결과가 인쇄됩니다.

아마도 쉘 스크립트를 사용하여 이를 관리할 수 있을 것입니다(레코더를 수동으로 제어한 다음 이를 사용하여 xdotool결과를 입력합니다). 하지만 해결책이 이미 존재할 수도 있으므로 이렇게 질문합니다.

답변1

나는 결국 이 목적을 위해 나만의 도구를 작성하게 되었습니다.

그것은 알려져있다너드 받아쓰기그것은(우수한 VOSK-API 기반).

관련 정보