Обучение программному обеспечению для распознавания речи в автономном режиме с половинными записями интервью
Я немного искал программное обеспечение для распознавания речи, которое работало бы в автономном режиме и позволяло бы мне обучать его с помощью полуфабрикатов. Кажется, что глубокая речь Мозиллы могла бы сделать эту работу. Проблема интервью, которые я должен расшифровать, состоит в том, что есть два голоса и нестандартные английские акценты. Кто-нибудь имеет опыт работы с DeepSpeech, чтобы сделать это, и может привести меня к учебнику? Или вы бы порекомендовали другое программное обеспечение (предпочтительно автономное и с открытым исходным кодом)?