Лучший подход к облачной речи "потоковое" решение?

Я делаю небольшую услугу транскрипции и думаю о моих лучших вариантах, любые советы очень приветствуются.

Я изменяю демо-версию google voice aiy, чтобы сделать расшифровку стенограммы (~1 час). для этого мне нужно хранить его в облачном хранилище Google.

я обнаружил, что транскрипция занимает примерно столько же времени, сколько и длина записи. (если это неправильно, пожалуйста, скажите мне!). так что для часовых записей, ожидающих окончания записи, слишком много времени. поэтому я решил начать загрузку в облачное хранилище Google в фоновом режиме.

Какова лучшая стратегия здесь?

  • я должен загрузить кусками, и расшифровать это в фоновом режиме? это будет означать, что куски должны перекрываться, не приведет ли это к дублированию в стенограмме?

  • я должен "поток" прямо в облачное хранилище Google? и не хранить ничего локально?

  • я должен транскрибировать напрямую? Как бы я сделал это для часовых сессий? (синхронная транскрипция для облачной речи Google менее 1 минуты)

Я просто хочу минимизировать время ожидания для расшифровки стенограммы и любые ошибки, вызванные этим.

0 ответов

Другие вопросы по тегам