Обучите Wav2Vec-U для пользовательского набора данных

Я нашел репозиторий Wav2Vec-U на github , но он плохо документирован. Интересно, есть ли для этого какая-нибудь поездная процедура. Я пытаюсь натренировать его на обычных голосовых аудиосистемах. Но для этого нужны файлы wrd, ltr и phn, к которым у меня нет доступа.

1 ответ

В настоящее время лучшая (единственная?) Соответствующая запись - это блокнот, размещенный на Kaggle. В разделе комментариев этой записной книжки есть ссылка на другую записную книжку, которая имеет непосредственное отношение к wrd, ltr, and phn files часть вашего вопроса.

Другие вопросы по тегам