Описание тега speech-recognition

Описание тега Вопросы с тегом

Распознавание речи (SR) - это междисциплинарная область компьютерной лингвистики, которая объединяет знания и исследования в области лингвистики, информатики и электротехники для разработки методологий и технологий, позволяющих распознавать и переводить разговорный язык в текст с помощью компьютеров. и компьютеризированные устройства, такие как интеллектуальные технологии и робототехника

Распознавание речи описывает процесс анализа потока аудиосигнала и преобразования его в текст. Это включает в себя разделение входных данных на значимые биты информации (токенизация) и определение релевантности сигнала. Последнее означает различение нерелевантных сигналов (например, шума на заднем плане) и слов, которые необходимо распознать.

В идеале механизмы распознавания речи или преобразования речи в текст не должны быть ориентированы на конкретный голос. Он должен уметь распознавать произвольные голоса.

Дальнейшая информация