Описание тега google-speech-to-text-api

6 ответов

Ошибка Google Cloud 403 Платежный аккаунт для проекта-владельца отключен в состоянии "отсутствует"

Я зашел в Google Cloud и включил проект, выставление счетов и Cloud Speech to Text API. Затем я загрузил файл.json. Затем я попытался выполнить этот базовый код в PyCharm. import os os.environ['GOOGLE_APPLICATION_CREDENTIALS'] ="instant-medium-…
0 ответов

Настройка прокси-сервера Google Speech-To-Text библиотекой SDK

Моя среда разработки при использовании Google Speech-To-Text API требует наличия прокси. Настройка прокси через HTTPS_PROXY Переменная окружения допустима, но я хотел бы знать, как установить прокси напрямую через библиотеку SDK.
1 ответ

Преобразование .mp4 в .wav в Python занимает слишком много времени

Мне нужно использовать библиотеку для преобразования.mp4 в.wav для получения транскрипции с помощью API Google для преобразования текста в текст. Но для преобразования файла размером 40 МБ требуется около 5 минут. Я пробовал Moviepy и другие библиот…
1 ответ

как передать метаданные Google Speech в текстовый API - Swift ios

Кто -нибудь, пожалуйста, помогите мне найти официальный документ модуля, используемого в этом примере: https://github.com/GoogleCloudPlatform/ios-docs-samples/tree/master/speech/Swift/Speech-gRPC-Streaming кроме того, я работаю над приложением для i…
1 ответ

Отправить результат Google-Speech-Text на сервер

Я пытаюсь отправить транскрипт, сгенерированный этим примером кода, из Google для преобразования речи в текст на сервер nodejs и отобразить его пользователю. var http = require('http'); const recorder = require('node-record-lpcm16'); const speech = …
0 ответов

Ошибка при записи телефонных звонков в режиме реального времени с использованием Twilio Media Streams и Google Speech-to-Text

Мы ссылались на эту ссылку - twilio.com/blog/live-transcribing-phone-calls-using-twilio-media-streams-and-google-speech-text. в котором нижеприведенная часть кода дает нам ошибку, //Create Stream to the Google Speech to Text API recognizeStream = cl…
2 ответа

Пытаюсь сделать программу распознавания речи на python, но программа меня не слышит

Первый блок except запускается каждый раз, когда я говорю в микрофон, пожалуйста, помогите! ''' import speech_recognition as sr # get audio from the microphone r = sr.Recognizer() with sr.Microphone() as source: print("Speak:") audio = r.listen(sour…
1 ответ

javax.sound.sampled.LineUnavailableException: строка с форматом PCM_SIGNED 16000.0 Гц, 16 бит, моно, 2 байта / кадр

Я создаю исполняемый jar из проекта в Eclipse, который состоит из базового примера кода для распознавания речи с использованием облачной речи. Как бы то ни было, проблема в том, что когда я запускаю код из Eclipse, он работает нормально, но когда я …
0 ответов

Google Speech to text API в веб-приложении

Я хочу попробовать Google Speech to text API в приложении JSF (которое для клиента генерирует html). Я попытался выполнить поиск, но подходящего ресурса в сети нет. Он доступен для Java SE, но не может быть преобразован в Java Web. Может ли кто-нибу…
1 ответ

Как остановить распознавание речи кнопкой на Android?

В настоящее время я использую RecognizerIntent для выполнения STT в приложении Android. Когда пользователь нажимает кнопку, появляется экран голосового ввода Google, пользователь может говорить, и он расшифровывается. Когда становится достаточно тих…
0 ответов

Речь Google в текст не работает на nodejs

Я создал приложение для преобразования речи в текст. веб-интерфейс реагировать и API-интерфейс nodejs. Я записываю звук из response и отправляю его в nodejs. но результат API Google пуст. как я могу это исправить? почему всегда получать пустые резул…
1 ответ

Инициализировать переменную Python с данными json

У меня очень простая ситуация: response = None response = client.recognize(config, audio) if response == None: response = results { alternatives { transcript: "" confidence: 0.0 } language_code: None } print(response) Я хочу инициализирова…
1 ответ

Запись звука с помощью NAudio меня отрубает

Я записываю звук, чтобы отправить его в Google, речь в текст, но когда я делаю звук с помощью naudio, он записывает меня всего 5 секунд, а затем прекращает запись. Я копирую код на C #, я впервые использую этот API, но я не знаю, почему он меня реже…
30 мар '20 в 02:22
0 ответов

Создание языкового стандарта Google Speech to Text для языка, отличного от английского

Я хочу интегрировать язык урду в свое приложение для Android с помощью Google Speech to Text. Язык урду поддерживается в соответствии с Google для преобразования речи в текст. Можете ли вы рассказать мне, как я могу это создать: class AimyboxApplica…
0 ответов

Callin Google Speech to Text API из Flask Celery вызывает сбой сельдерея

Пытаюсь преобразовать речь Google в текст из сельдерея, но рабочий поток дает сбой. Ниже приведен код, который выполняется из задачи сельдерея. # Google speech to text function from google.cloud import speech_v1p1beta1 from google.cloud.speech_v1p1b…
1 ответ

Как извлечь расшифровку стенограммы с несколькими выступающими из вывода JSON с расшифровкой речи Google Video Intelligence API с помощью jq?

Я тестирую преобразование речи в текст Google Video Intelligence для расшифровки эпизодов подкастов с несколькими динамиками. Я извлек пример и опубликовал его в gist: output.json. cat file.json | jq '.response.annotationResults[].speechTranscriptio…
0 ответов

Язык загрузки речи в текст, отличный от списка, предоставленного Google

В настоящее время я разрабатываю приложение, в котором я хочу преобразовать речь в текст для языка "маратхи" в автономном режиме. но Google предоставляет только ограниченные языки для преобразования речи в текст в автономном режиме. Могу ли я загруз…
0 ответов

Расшифровка аудио из прямой трансляции

Я пытаюсь расшифровать звук из живого аудиопотока, используя этот учебник: https://cloud.google.com/speech-to-text/docs/streaming-recognize Мне удалось заставить его работать с микрофоном, но мне интересно, можно ли его использовать для расшифровки …
0 ответов

Уверенность речи в текст на уровне слов не работает для Google API в Python

Я включил доверие на уровне слов для Google Speech To Text API в Python. Но я не могу получить уверенность на уровне слов, так как он всегда отвечает: "Сервис не отвечает". # setting the config enable_word_time_offsets = True enable_automatic_punctu…
0 ответов

Преобразование речи в текст Google зависает при response = client.recognize(config audio)

У меня проблема, и я не знаю, что делать. Я хочу расшифровать аудиофайл с помощью преобразования речи Google в текст. Когда я выполняю скрипт python, все в порядке, но код зависает на "Response = Client.recognize(config, audio)". Сообщение об ошибке…