Лучший подход к облачной речи "потоковое" решение?
Я делаю небольшую услугу транскрипции и думаю о моих лучших вариантах, любые советы очень приветствуются.
Я изменяю демо-версию google voice aiy, чтобы сделать расшифровку стенограммы (~1 час). для этого мне нужно хранить его в облачном хранилище Google.
я обнаружил, что транскрипция занимает примерно столько же времени, сколько и длина записи. (если это неправильно, пожалуйста, скажите мне!). так что для часовых записей, ожидающих окончания записи, слишком много времени. поэтому я решил начать загрузку в облачное хранилище Google в фоновом режиме.
Какова лучшая стратегия здесь?
я должен загрузить кусками, и расшифровать это в фоновом режиме? это будет означать, что куски должны перекрываться, не приведет ли это к дублированию в стенограмме?
я должен "поток" прямо в облачное хранилище Google? и не хранить ничего локально?
я должен транскрибировать напрямую? Как бы я сделал это для часовых сессий? (синхронная транскрипция для облачной речи Google менее 1 минуты)
Я просто хочу минимизировать время ожидания для расшифровки стенограммы и любые ошибки, вызванные этим.