Описание тега speech-recognition
Распознавание речи (SR) - это междисциплинарная область компьютерной лингвистики, которая объединяет знания и исследования в области лингвистики, информатики и электротехники для разработки методологий и технологий, позволяющих распознавать и переводить разговорный язык в текст с помощью компьютеров. и компьютеризированные устройства, такие как интеллектуальные технологии и робототехника
Распознавание речи описывает процесс анализа потока аудиосигнала и преобразования его в текст. Это включает в себя разделение входных данных на значимые биты информации (токенизация) и определение релевантности сигнала. Последнее означает различение нерелевантных сигналов (например, шума на заднем плане) и слов, которые необходимо распознать.
В идеале механизмы распознавания речи или преобразования речи в текст не должны быть ориентированы на конкретный голос. Он должен уметь распознавать произвольные голоса.
Дальнейшая информация