Цепные API потоковой передачи в Google Cloud Platform
Мне нужно получить аудиопоток, получить транскрипцию, а затем транслировать транскрипцию в другой сервис, это может быть перевод или API на естественном языке; необходимо непрерывно обрабатывать входной голосовой поток. Есть ли у кого-нибудь идеи или предложения о том, как передать выходные данные речевого API в качестве входных данных другому API-интерфейсу dowsnstream?
1 ответ
Если мы посмотрим здесь,
https://cloud.google.com/speech-to-text/docs/streaming-recognize
Мы находим некоторую полезную информацию о получении потока преобразования речи в текст. Кажется, что происходит то, что регистрируется обратный вызов, и когда обрабатывается "кусок" переведенного текста, вызывается обратный вызов, передавая переведенное аудио как текстовое представление. Именно в этот момент у вас есть блок текста, который затем будет вашей обязанностью обрабатывать. Из вашего описания кажется, что вы затем вызвали бы свой нисходящий API, передавая полученный текст.