Это метка для распознавателей речи, таких как яндекс.Алиса и так далее.
Questions tagged [распознавание-речи]
127 questions
1
vote
2 answers
Подскажите библиотеку для перевода аудио в текст
Необходимо транскрибировать аудиофайл с начиткой в текст.
Было бы хорошо использовать библиотеку на серверном языке программирования с записью результата в базу данных.
Ожидаемый результат:
Библиотека (или API) на любом языке программирования, где…
1
vote
1 answer
адаптация акустической модели в cmu sphinx
Передо мной стоит задача - адаптировать русскую акустическую модель. Выполнял все как показано в документации но на этапе Accumulating observation counts при запуске следующего скита,
./bw \
-hmmdir model \
-moddeffn model/mdef.txt
-ts2cbfn .ptm.…
3lolo
- 11
1
vote
0 answers
Человек зачитывает устно предложение/слово и инструмент оценивает произношение (условно как в караоке)
Мне бы хотелось понять существует ли готовое решение или можно ли разработать что-то, что когда человек произносит слово на русском и инструмент проверяет насколько идеально человек произнес то или иное слово. Как я понимаю, это про распознавание…
Соня
- 19
0
votes
1 answer
Распознавание речи для чайников
Я начал изучать распознавание речи. Я читал статьи много стало непонятно(Как обрабатывать MFCC к примеру и т.д. ). Посоветуйте, какой-нибудь хороший учебник, где все подробно описано. Ответ типа есть готовые инструменты не пойдет. Я хочу понимать…
Шерзод Ёров
- 282
0
votes
0 answers
Преобразование фурье
Написал программу, которая извлекает sample из Wav. В Wav файле есть 2 канала(стерео). Хочу применить преобразование фурье, но запутался в одном. Я не понимаю, как эти два семпла объединить в один и применить формулу прямого преобразования. X(k) =…
Шерзод Ёров
- 282
0
votes
0 answers
Как определить при распознавании голоса, является точка разделителем разрядов или дробной части?
Я делаю приложение которое использует голосовой ввод. Данные голосового ввода числа, цифры и математические знаки. Я вызываю RecognizerIntent.ACTION_RECOGNIZE_SPEECH и пользуюсь результатом. Но, распознавание чисел идет не так как хотелось бы.…
Игорь
- 13
- 2