Описание тега google-speech-to-text-api
6
ответов
Ошибка Google Cloud 403 Платежный аккаунт для проекта-владельца отключен в состоянии "отсутствует"
Я зашел в Google Cloud и включил проект, выставление счетов и Cloud Speech to Text API. Затем я загрузил файл.json. Затем я попытался выполнить этот базовый код в PyCharm. import os os.environ['GOOGLE_APPLICATION_CREDENTIALS'] ="instant-medium-…
04 июл '20 в 20:48
0
ответов
Настройка прокси-сервера Google Speech-To-Text библиотекой SDK
Моя среда разработки при использовании Google Speech-To-Text API требует наличия прокси. Настройка прокси через HTTPS_PROXY Переменная окружения допустима, но я хотел бы знать, как установить прокси напрямую через библиотеку SDK.
17 июл '20 в 08:54
1
ответ
Преобразование .mp4 в .wav в Python занимает слишком много времени
Мне нужно использовать библиотеку для преобразования.mp4 в.wav для получения транскрипции с помощью API Google для преобразования текста в текст. Но для преобразования файла размером 40 МБ требуется около 5 минут. Я пробовал Moviepy и другие библиот…
02 мар '20 в 13:57
1
ответ
как передать метаданные Google Speech в текстовый API - Swift ios
Кто -нибудь, пожалуйста, помогите мне найти официальный документ модуля, используемого в этом примере: https://github.com/GoogleCloudPlatform/ios-docs-samples/tree/master/speech/Swift/Speech-gRPC-Streaming кроме того, я работаю над приложением для i…
13 апр '20 в 22:35
1
ответ
Отправить результат Google-Speech-Text на сервер
Я пытаюсь отправить транскрипт, сгенерированный этим примером кода, из Google для преобразования речи в текст на сервер nodejs и отобразить его пользователю. var http = require('http'); const recorder = require('node-record-lpcm16'); const speech = …
05 май '20 в 01:17
0
ответов
Ошибка при записи телефонных звонков в режиме реального времени с использованием Twilio Media Streams и Google Speech-to-Text
Мы ссылались на эту ссылку - twilio.com/blog/live-transcribing-phone-calls-using-twilio-media-streams-and-google-speech-text. в котором нижеприведенная часть кода дает нам ошибку, //Create Stream to the Google Speech to Text API recognizeStream = cl…
27 июл '20 в 08:27
2
ответа
Пытаюсь сделать программу распознавания речи на python, но программа меня не слышит
Первый блок except запускается каждый раз, когда я говорю в микрофон, пожалуйста, помогите! ''' import speech_recognition as sr # get audio from the microphone r = sr.Recognizer() with sr.Microphone() as source: print("Speak:") audio = r.listen(sour…
07 июн '20 в 14:39
1
ответ
javax.sound.sampled.LineUnavailableException: строка с форматом PCM_SIGNED 16000.0 Гц, 16 бит, моно, 2 байта / кадр
Я создаю исполняемый jar из проекта в Eclipse, который состоит из базового примера кода для распознавания речи с использованием облачной речи. Как бы то ни было, проблема в том, что когда я запускаю код из Eclipse, он работает нормально, но когда я …
13 фев '20 в 16:34
0
ответов
Google Speech to text API в веб-приложении
Я хочу попробовать Google Speech to text API в приложении JSF (которое для клиента генерирует html). Я попытался выполнить поиск, но подходящего ресурса в сети нет. Он доступен для Java SE, но не может быть преобразован в Java Web. Может ли кто-нибу…
25 янв '20 в 03:42
1
ответ
Как остановить распознавание речи кнопкой на Android?
В настоящее время я использую RecognizerIntent для выполнения STT в приложении Android. Когда пользователь нажимает кнопку, появляется экран голосового ввода Google, пользователь может говорить, и он расшифровывается. Когда становится достаточно тих…
23 фев '20 в 13:58
0
ответов
Речь Google в текст не работает на nodejs
Я создал приложение для преобразования речи в текст. веб-интерфейс реагировать и API-интерфейс nodejs. Я записываю звук из response и отправляю его в nodejs. но результат API Google пуст. как я могу это исправить? почему всегда получать пустые резул…
13 мар '20 в 08:12
1
ответ
Инициализировать переменную Python с данными json
У меня очень простая ситуация: response = None response = client.recognize(config, audio) if response == None: response = results { alternatives { transcript: "" confidence: 0.0 } language_code: None } print(response) Я хочу инициализирова…
20 мар '20 в 00:28
1
ответ
Запись звука с помощью NAudio меня отрубает
Я записываю звук, чтобы отправить его в Google, речь в текст, но когда я делаю звук с помощью naudio, он записывает меня всего 5 секунд, а затем прекращает запись. Я копирую код на C #, я впервые использую этот API, но я не знаю, почему он меня реже…
30 мар '20 в 02:22
0
ответов
Создание языкового стандарта Google Speech to Text для языка, отличного от английского
Я хочу интегрировать язык урду в свое приложение для Android с помощью Google Speech to Text. Язык урду поддерживается в соответствии с Google для преобразования речи в текст. Можете ли вы рассказать мне, как я могу это создать: class AimyboxApplica…
04 апр '20 в 22:20
0
ответов
Callin Google Speech to Text API из Flask Celery вызывает сбой сельдерея
Пытаюсь преобразовать речь Google в текст из сельдерея, но рабочий поток дает сбой. Ниже приведен код, который выполняется из задачи сельдерея. # Google speech to text function from google.cloud import speech_v1p1beta1 from google.cloud.speech_v1p1b…
03 май '20 в 19:41
1
ответ
Как извлечь расшифровку стенограммы с несколькими выступающими из вывода JSON с расшифровкой речи Google Video Intelligence API с помощью jq?
Я тестирую преобразование речи в текст Google Video Intelligence для расшифровки эпизодов подкастов с несколькими динамиками. Я извлек пример и опубликовал его в gist: output.json. cat file.json | jq '.response.annotationResults[].speechTranscriptio…
10 май '20 в 16:32
0
ответов
Язык загрузки речи в текст, отличный от списка, предоставленного Google
В настоящее время я разрабатываю приложение, в котором я хочу преобразовать речь в текст для языка "маратхи" в автономном режиме. но Google предоставляет только ограниченные языки для преобразования речи в текст в автономном режиме. Могу ли я загруз…
31 янв '20 в 08:18
0
ответов
Расшифровка аудио из прямой трансляции
Я пытаюсь расшифровать звук из живого аудиопотока, используя этот учебник: https://cloud.google.com/speech-to-text/docs/streaming-recognize Мне удалось заставить его работать с микрофоном, но мне интересно, можно ли его использовать для расшифровки …
14 фев '20 в 02:37
0
ответов
Уверенность речи в текст на уровне слов не работает для Google API в Python
Я включил доверие на уровне слов для Google Speech To Text API в Python. Но я не могу получить уверенность на уровне слов, так как он всегда отвечает: "Сервис не отвечает". # setting the config enable_word_time_offsets = True enable_automatic_punctu…
19 фев '20 в 16:54
0
ответов
Преобразование речи в текст Google зависает при response = client.recognize(config audio)
У меня проблема, и я не знаю, что делать. Я хочу расшифровать аудиофайл с помощью преобразования речи Google в текст. Когда я выполняю скрипт python, все в порядке, но код зависает на "Response = Client.recognize(config, audio)". Сообщение об ошибке…
25 фев '20 в 12:00