Описание тега google-speech-api

С помощью Google Speech API вы можете конвертировать речь в текстовый файл или в прямую трансляцию.
0 ответов

Аутентификация Google Cloud Speech через GRPC на C# с использованием ключа API

Я хочу реализовать потоковое распознавание голоса на C# на GRPC, но иметь только API-ключ ключ этого типа -> https://cloud.google.com/docs/authentication/api-keys По поиску в Интернете я знаю, что на других языках (Android, IO) они могут "перехватит…
01 окт '18 в 21:20
0 ответов

REST-API получает ошибку 403 при инициализации потоков

Я начал работать с google speech api, но когда я инициализирую streams Я все еще получаю ошибку 403. Я включил User-Agent в запросе, но, похоже, все равно выдает ошибку. Api key действительно действителен, потому что я получаю ответ при запросе в ко…
1 ответ

INVALID_ARGUMENT: размер полезной нагрузки запроса превышает ограничение: 10485760 байт

Я впервые использую GCS Speech API для проекта, чтобы преобразовать серию аудиофайлов в текст. Каждый файл длится около 60 минут и представляет собой человека, разговаривающего непрерывно в течение всего времени. Я установил GC SDK и использую его д…
1 ответ

Ограничения Google Speech API

Может кто-нибудь поделиться ограничением Google Speech API? Мы слышали ниже ограничения до сих пор: Не могу расшифровать аудиофайлы более 60 секунд Не может работать с двумя каналами (агент и клиент) Спасибо
30 авг '17 в 18:12
1 ответ

Как перевести потоковую трансляцию с помощью Google Speech API?

Это документы Google Speech API: https://cloud.google.com/speech/docs/sync-recognize Я пробую этот API в течение 2 недель. но до сих пор не могу решить мою основную цель (перевести потоковую трансляцию). Я использую PHP. (другие предложения разрешен…
1 ответ

Google Speech API V2

Я перешел по этой ссылке для генерации ключей API, но Speech API не был найден на консоли. Пример приложения, которым я следую, находится здесь: https://github.com/gillesdemey/google-speech-v2/ Я продолжаю получать сообщение об ошибке: У вашего клие…
21 окт '14 в 11:25
1 ответ

Бесплатное распознавание речи для приложения C# WinForm

Я пытаюсь найти бесплатное распознавание речи для исполняемого файла C# Windows Form Application, который может работать как Google Speech Recognition, распознавать и преобразовывать абсолютно новые слова в текст. Я пытался использовать System.Speec…
0 ответов

Node.JS Ошибка: 502 Bad Gateway | ClientDuplexStream | Google Speech API

Через некоторое время при запуске моего приложения узла выдается это необученное исключение, и я не знаю, почему и где его обработать. Я попытался добавить eventEmitters для ошибки, но не повезло. Error: 502:Bad Gateway at ClientDuplexStream._emitSt…
2 ответа

Как использовать Google Speech API для распознавания смешанных языков с переключением кодов?

Обычно люди используют свой родной язык + английский для общения. Мне нужен Google API для распознавания обоих языков в образце речи. Например: "aaj ka weather kaisa hai" это предложение содержит языки хинди (hi-IN) и английский (en-IN) Как настроит…
2 ответа

Google Speech Api получает текст из аудиофайла, возвращающего {"result":[]} в C#

Я пытаюсь создать приложение для Windows, в котором я могу взять имеющийся у меня аудиофайл и преобразовать голос в него в текстовый файл с помощью API распознавания речи Google. Вот что я сделал: 1) Я зашел сюда https://groups.google.com/a/chromium…
03 фев '16 в 09:06
0 ответов

Google Speech API Недопустимый аргумент "Аудио контент" Слишком долго

Я получаю сообщение об ошибке при попытке отправить пакет аудиоданных в речевой API Google для транскрибирования. Иногда это работает, а иногда нет. Когда это не работает, я получаю сообщение об ошибке: Traceback (most recent call last): File "/User…
24 июл '17 в 22:37
1 ответ

Облачная платформа Google: преобразование речи в текст больших медиафайлов

Я пытаюсь извлечь текст из медиа-файла mp4, загруженного с YouTube. Как я использую облачную платформу Google, так и подумал, чтобы попробовать Google облачной речи. После всех установок и конфигураций я скопировал следующий фрагмент кода, чтобы нач…
1 ответ

Ошибка RecognitionConfig должна быть либо неопределенной, либо соответствовать значению в аудио заголовке FLAC в речи Google для текстового API

Я уже пытался преобразовать звук из стерео в моно, но безуспешно, я пытался изменить скорость в герцах, но тоже безуспешно from pydub import AudioSegment from google.cloud import speech_v1p1beta1 as speech import os, logging import urllib.request KE…
1 ответ

Google Cloud Speech API: Nodejs

Я видел демо на сайте google dev, а также на git hub https://github.com/GoogleCloudPlatform/nodejs-docs-samples/tree/master/speech. У меня вопрос как передать языковой параметр? Я использую это так: var speech = require('@google-cloud/speech')({ pro…
0 ответов

Google речь к тексту API в React Native вопрос

Я пытаюсь превратить следующий пример в код, который я могу использовать в приложении реагирования. Я пытался использовать fetch, но это пока не помогло. Если есть пример, дайте мне знать. const record = require("node-record-lpcm16"); // Imports the…
0 ответов

Google речевой API - неправильная версия в модулях

Мы разрабатываем мобильное приложение, и мы используем распознавание речи Google, мы добавили его в проект Cocoapods, 1.2.1 pod 'googleapis',:path => '.' В каталоге pods мы видели папку v1beta1, но в примере интеграции Google мы видим тот же файл po…
27 дек '17 в 20:45
1 ответ

Установить права доступа для объекта gs bucket для речевого API

Я хочу переписать длинный аудиофайл в текст. Поэтому я создал ведро и установил его как частное использование gsutil acl set private gs://bucket затем я установил доступ только для загрузки из определенного аккаунта gsutil acl ch -u myaccount@provid…
1 ответ

Распознать файл mp4 с помощью Google Speech

Я использую почтальон для того, чтобы выполнить метод POST для API Google Cloud Speech: https://speech.googleapis.com/v1/speech:recognize?key= { "config": { "encoding": "FLAC", "sampleRateHertz": 16000, "languageCode": "en-US" }, "audio": { "content…
1 ответ

403(запрещено), ошибка неверного ключа в Google Speech API

Я пытаюсь получить доступ к речь API, используя следующий URL-адрес и всегда получаю 403(Запрещено) Ошибка, Неверный ключ. https://www.google.com/speech-api/v2/recognize?output=json⟨=en-us&key;={MyKey} Я попытался использовать и ключ сервера, и…
5 ответов

Распознавание речи в автономном режиме в браузере

Я работаю над продуктом, который должен принимать входные данные от пользователя и выполнять определенные действия на его основе. Мы реализовали это с помощью окна чата с помощью набора текста, и это служит нашей цели. В будущих выпусках мы хотим до…