Метка времени аудио с любого языка, учитывая источник звука и точную транскрипцию
Я ищу, чтобы получить примерно точные метки времени для каждого слова в аудиофайле. У меня также есть оригинальный текст для аудио файла, который можно использовать в качестве источника перекрестных ссылок. Это похоже на "извлечение звука", которое, как мне кажется, когда у вас есть только входное аудио, тогда как здесь у меня есть и аудио, и текст.
В идеале я хотел бы сделать это, используя программное обеспечение с открытым исходным кодом, и хотел бы принять большинство языков в качестве входных данных (например, английский, французский, немецкий, испанский и в идеале русский и мандаринский языки).
Я бы даже принял решение, которое могло бы соответствовать только меткам времени различных слов (например, если транскрипция была не совсем точной). Тогда будет проще сопоставить выходной текст с оригиналом, чтобы помочь перестроить вещи.
1 ответ
Я так работаю в своих исследованиях в области лингвистики. Я использую программу под названием ELAN, и я только что заметил, что у них более свежая версия (4.5), чем та, которую я сейчас установил на своем Mac. Программное обеспечение было разработано, чтобы помочь работать с глухими языками, поэтому оно поддерживает видео и аудио кадры и позволяет вам точно выровнять ваши транскрипции. Я использую версию 3.9, и эта версия использовала автоматическое сегментирование слов, что, как я думаю, вы хотите сделать. Я не вижу этой функции в последней версии, хотя, возможно, с некоторыми копаниями она все еще есть.
Конечно, если вам нужна более ранняя версия, вы всегда можете использовать ELAN 3.9. ELAN работает на Mac, Linux и Windows, так как он основан на Java (я помню). Вот ссылка на ELAN. Есть и другое программное обеспечение для лингвистических аннотаций. Еще один, который действительно хорош, но сложен в освоении. Это называется ПРААТ.
Я надеюсь, это поможет вам. Если я не совсем правильно понял ваши потребности, дайте мне знать, и я посмотрю, смогу ли я уточнить свой ответ для вас. CHEERS!