speech-recognition

음성 녹음 및 번역
speech-recognition

음성 녹음 및 번역

"wav"를 "flac"로 변환하는 데 문제가 있습니다. 주문하다: arecord -D plughw:0,0 -f cd -t wav -d 0 -q -r 16000 | flac - -s -f --best --sample-rate 16000 -o daveconroy.flac 항상 다음을 제공합니다. 오류: 원시 형식 옵션(--endian, --sign, --channels, --bps 및 --sample-rate)은 원시가 아닌 입력에 허용되지 않습니다. 다음 명령을 사용하여 녹음할 수 있지만 재생할...

Admin

X11을 사용하여 음성 인식을 수동으로 시작/종료하는 방법은 무엇입니까?
speech-recognition

X11을 사용하여 음성 인식을 수동으로 시작/종료하는 방법은 무엇입니까?

잘 작동하는 음성 인식 소프트웨어를 찾았습니다(참조이 문제), 여전히 통합이 필요하며 제 경우에는 이를 활성화하는 쉬운 방법이 필요합니다. 내가 찾고 있는 결과는 다음과 같습니다. 단축키를 누르면 받아쓰기가 시작됩니다. 받아쓰기를 종료하려면 단축키를 누르세요. 키보드로 입력한 것처럼 결과가 인쇄됩니다. 아마도 쉘 스크립트를 사용하여 이를 관리할 수 있을 것입니다(레코더를 수동으로 제어한 다음 이를 사용하여 xdotool결과를 입력합니다). 하지만 해결책이 이미 존재할 수도 있으므로 이렇게 질문합...

Admin

Linux 음성 인식 소프트웨어에 대한 피드백
speech-recognition

Linux 음성 인식 소프트웨어에 대한 피드백

Linux용 음성 인식 소프트웨어에 대한 피드백을 받고 싶습니다. 무료든 유료든.. 모든 프로그램에서 입력할 수 있으며 Enter 키와 마우스 오른쪽 버튼 클릭이 가능합니다. 현재 NaturallySpeaking을 사용하고 있습니다. Windows 10에서 전환하고 싶습니다. 감사해요 ...

Admin

간단한 음성 명령 감지
speech-recognition

간단한 음성 명령 감지

마이크에서 간단한 단어나 문구를 감지하고 해당 문구를 기반으로 작업을 수행하고 싶습니다. Python 라이브러리와 Google Text to Speech를 살펴봤지만 이것들은 과잉 인 것 같았습니다1 . 영어의 모든 음소나 단어를 인식할 수 있는 것이 필요하지 않습니다. 단지 "go to bed" 또는 심지어 "sleep"과 같은 특정 문구를 감지하여 컴퓨터를 절전 모드로 전환하고 싶을 뿐입니다. 이것저것 검색해봤는데 대부분 10년 전의 받아쓰기 프로그램과 게시물들만 찾았네요. 1. 예를 들어 우연히...

Admin

Python 프로그램을 실행하는 중 오류가 발생했습니다.
speech-recognition

Python 프로그램을 실행하는 중 오류가 발생했습니다.

음성 인식 및 py 오디오로 Python을 실행하는 동안 오류가 발생했습니다. ALSA lib pcm_dsnoop.c:641:(snd_pcm_dsnoop_open) 슬레이브 ALSA lib를 열 수 없습니다 pcm_dmix.c:1089:(snd_pcm_dmix_open) 슬레이브 ALSA lib를 열 수 없습니다 pcm.c:2642:(snd_pcm_open_noupdate) 알 수 없는 PCM 카드.pcm.rear ALSA lib pcm.c:2642:(snd_pcm_open_noupdate) 알 수...

Admin

Kali - kaldi/egs/voxforge/s5 run.sh 문제
speech-recognition

Kali - kaldi/egs/voxforge/s5 run.sh 문제

시작하려고 했으나 run.sh실패했습니다. 누구든지 문제를 해결하는 방법을 알고 있나요? 시작 후 터미널의 텍스트 run.sh: There was an error running the SLURM sbatch command. The command was: '/usr/bin/sbatch -o exp/make_mfcc/train/q/make_mfcc_train.log --export=none,PATH=/home/kvcper/kaldi/egs/voxforge/s5/../../../src/bin:/home/...

Admin

Linux용 편안한 오프라인 음성 인식 소프트웨어가 필요하십니까?
speech-recognition

Linux용 편안한 오프라인 음성 인식 소프트웨어가 필요하십니까?

나는 ~을 찾고 있다오프라인Linux용 음성 인식 소프트웨어는 독일어도 처리하며 사용 및 구성이 쉽습니다. 나는 CMU Sphinx와 다른 여러 가지를 시도했지만 모두 한 가지 공통점이 있습니다. 주로 좋은 매뉴얼이 부족하고 개념이 매우 대략적이기 때문에 설치/사용하기가 너무 복잡합니다. "가용성"이라는 용어를 사용합니다). 그렇다면 제한된 시간 내에 설정 및 구성할 수 있고 인식된 명령을 기반으로 스크립트를 실행할 수 있으며 완전히 오프라인으로 작동할 수 있는 음성 인식 소프트웨어가 있습니까? ...

Admin

Julius와 함께 전체 사전 파일을 사용하거나 null을 반환합니다.
speech-recognition

Julius와 함께 전체 사전 파일을 사용하거나 null을 반환합니다.

성공적으로 설정했습니다율리우스내 자신의 구문과 .voca 파일을 사용합니다. 내가 겪고 있는 문제는 말하는 문구가 .voca 파일에서 아무 것도 아닌 것처럼 들리더라도 항상 제안된 응답을 반환한다는 것입니다. 일치하는 항목이 없으면 null을 반환하거나 전체 사전 파일을 사용하여 단어를 추출하는 솔루션을 찾고 싶습니다. 누군가 내가 이것을 알아내도록 도와주거나 적어도 올바른 방향을 알려줄 수 있습니까? ...

Admin

Linux에 유용한 음성 인식 소프트웨어가 있습니까?
speech-recognition

Linux에 유용한 음성 인식 소프트웨어가 있습니까?

질문의 간략한 버전: 저는 Linux에서 실행되고 정확도와 유용성이 좋은 음성 인식 소프트웨어를 찾고 있습니다. 모든 라이센스와 가격은 괜찮습니다. 텍스트를 받아쓰게 하고 싶기 때문에 음성 명령에만 국한되어서는 안 됩니다. 자세한 내용은: 다음을 시도했지만 결과가 만족스럽지 않습니다. 카네기멜론대학교 스핑크스 C음성 제어 귀 율리우스 카디(예를 들어,Kaldi GStreamer 서버) IBM 비아보이스(Linux에서 실행되었지만 몇 년 전에 중단되었습니다) NICO 인공 신경망 툴킷 열린 마음 연...

Admin

Pocketsphinx_continuous의 출력을 파일로 리디렉션
speech-recognition

Pocketsphinx_continuous의 출력을 파일로 리디렉션

나는 추악한 명령을 가지고 있습니다 : pocketsphinx_continuous -samprate 48000 -nfft 2048 -hmm /usr/local/share/pocketsphinx/model/en-us/en-us -lm 9745.lm -dict 9745.dic -inmic yes 분해:소음을 듣고, 소음이 감지되면 이를 듣고 음성 인식을 수행합니다. 이제 명령 출력에는 많은 쓰레기가 있으며 단 한 줄만 중요합니다. 다음은 음성 인식의 출력입니다. READY.... Listenin...

Admin

C++ 컴파일된 프로그램을 백그라운드에서 실행하고 필요할 때 입력을 보냅니다.
speech-recognition

C++ 컴파일된 프로그램을 백그라운드에서 실행하고 필요할 때 입력을 보냅니다.

다음과 같은 구조를 갖는 UNIX 환경용으로 C++로 작성된 컴파일된 프로그램이 있습니다. int main(){ ... LoadEngine() ... while(1){ std::cin >> buffer; ... ExecuteFunction(buffer); } } 엔진을 로드하는 데 시간이 꽤 걸리기 때문에 먼저 백그라운드에서 프로그램을 시작한 다음 필요할 때 입력을 보내 보았습니다. 끝에 표준 앰퍼샌드를 추가하여 프로그램을 실행하면 프로그램이 백그라운드에서 실행...

Admin

Pocketsphinx_continuous를 stdin에서 읽을 수 있나요?
speech-recognition

Pocketsphinx_continuous를 stdin에서 읽을 수 있나요?

-adcdev "입력에 사용할 오디오 장치의 이름"이라는 인수가 있지만 이것이 표준 입력이 될 수 있는지 여부는 밝히지 않습니다. Pocketsphinx_continuous를 stdin에서 읽을 수 있나요? ...

Admin

사운드 레벨이 충분히 낮아질 때까지 녹음하세요.
speech-recognition

사운드 레벨이 충분히 낮아질 때까지 녹음하세요.

현재 Pi에서 지속적인 음성 인식을 구현하려고 합니다. 두 개의 스레드를 실행하여 이 작업을 수행합니다. 그 중 하나는 arecordX초 동안 계속해서 (bash 스크립트로) 기록하고 해당 정보를 WAV에 저장한 다음 매번 다시 시작합니다. 이 WAV가 작성되면 다른 스레드가 WAV 파일에 대한 인식을 수행합니다. 이것은 잘 작동하지만 사용자의 문장이 실수로 끊어졌다가 다음 녹음 루프에서 다시 시작되면 문장이 두 인식 결과 사이에서 조각화됩니다. 내 질문은: 사운드 레벨이 특정 임계값 아래로 떨어...

Admin

ALSA로 인해 pythonpeer_recognitionlib 마이크 클래스를 사용할 수 없습니다.
speech-recognition

ALSA로 인해 pythonpeer_recognitionlib 마이크 클래스를 사용할 수 없습니다.

Raspberry Pi용 음성 인식 프로그램을 작성하려고 하는데 Python의 음성 인식 라이브러리를 사용하는 데 몇 가지 문제가 있습니다. 오류 메시지(아래 게시됨)를 보면 잘못된 사운드 카드에 액세스하는 것이 문제인 것 같지만 PyAudio(마이크 클래스에서 사용하는 것으로 생각됨)와 "arecord"를 사용하여 녹음할 수 있습니다. 다음은 내가 실행하려는 코드입니다. import speech_recognition as sr r = sr.Recognizer() with sr.Microph...

Admin