Описание тега azure-speech

Azure Speech - это облачная служба преобразования речи в текст в семействе API машинного обучения и искусственного интеллекта Microsoft Azure.
0 ответов

Символ Azure Speech to Text не печатается во время разговора

Я использую Azure для преобразования текста в текст в одном из моих проектов и @ Символ не печатается, когда мы говорим с ним при преобразовании речи в текст. Ex. ABC@gmail.com печатает ABC по курсу gmail.com или ABC на gmail.com. Должно быть распеч…
0 ответов

Apl Translator Speech имеет автоматическое определение языка

В настоящее время я устанавливаю параметр from, но было бы лучше, если бы он мог быть обнаружен автоматически Спасибо Стив
09 сен '18 в 16:16
0 ответов

Лазурная речь в текстовый SDK: порция больших аудиофайлов

Я не совсем понимаю, как разбить ваши аудиофайлы на более мелкие фрагменты при использовании библиотеки websocket. Есть ли в SDK функция, позволяющая вам это делать, или это то, что вы должны написать сами? Для справки: https://github.com/Azure-Samp…
27 ноя '17 в 13:01
0 ответов

Azure Речь в текстовом демо из-за ошибки.

Я пытаюсь запустить Azure речь ( здесь) после запуска приложения из-за ошибки. ConnectionEstablishErrorEvent и код состояния 1006 Следующие ошибки. ConsoleLoggingListener.ts:29 2018-08-07T03:52:33.658Z | ConnectionEstablishErrorEvent | metadata: {} …
07 авг '18 в 04:09
0 ответов

Интеграция Azure Bot с Azure Speech Services

Есть ли возможный способ интеграции речевых сервисов с ботом? Итак, я хотел бы знать, каков процесс интеграции речевых служб с ботом? Как можно выполнить интеграцию с ботом через ключ, полученный из созданной службы речи Azure? А как проверить, рабо…
0 ответов

AudioConfig.FromStreamInput в MS когнитивно-поддерживаемых битрейтов?

Я экспериментировал с непрерывным распознаванием, используя MS Cognitive речь API и UCMA (с SFB), используя 1.1.0 SDK. У меня есть несколько вариантов работы распознавания (с использованием SpeechRecognitionConnector UCMA для доступа к звуку вызова …
0 ответов

Распознавание нескольких голосов с помощью Microsoft Speech API?

Я хотел бы знать, поддерживает ли Microsoft Speech API на Python распознавание нескольких голосов. Я видел бета-версию SDK Speaker Recognition, но мне было интересно, была ли эта функция уже в Speech SDK или нет. Я проверил всю документацию по метод…
0 ответов

Отправка аудиопотока из Wowza в облачный сервис "речь в текст"

Я хотел бы автоматически создавать субтитры для видеопотока (автоматические субтитры). Можно ли отправить аудиопоток с сервера Wowza напрямую в облачную службу "речь в текст", такую ​​как IBM Watson Speech to Text , Microsoft Azure Bing Speech API и…
0 ответов

Как мне загрузить все мои символы в VS?

Я пытаюсь запустить перевод речи в речь лазурного цвета, и я просто продолжаю загружать все свои символы, кроме этого, и я не знаю, как это исправитьThe thread 0xbfc has exited with code -1073741510 (0xc000013a). The thread 0x16c0 has exited with co…
0 ответов

LUIS: Речь SDK - В SpeechConfig, как установить URL-адрес прокси-сервера

Я пытаюсь использовать tutorial-speech-intent-recognition образец для обучения, как работать с LUIS, К сожалению, я нахожусь за брандмауэром и веб-прокси, который имеет URL: http://proxy.mycompany.com:xxxx/nbproxy.pac Тем не менее SpeechConfig SetPr…
14 ноя '18 в 09:51
0 ответов

Использование Microsoft Speech API для расшифровки аудиофайла заканчивается преждевременно

Я использую речевую службу Microsoft Azure для расшифровки примера файла WAV. public static async Task Test() { var factory = SpeechFactory.FromSubscription("<YOUR KEY HERE>", "westus"); using (var recognizer = factory.CreateSpeechRecognizerWi…
11 май '18 в 16:51
1 ответ

Azure Speech to Text перестает работать через 3–4 минуты в Android SDK версии 1.2.2

Мы сталкиваемся с проблемой использования речи к тексту API, он работает нормально около 4 минут, и вдруг перестает работать. При проверке в logcat (Android studio logger) отображаются ошибки, как показано ниже. Мы используем его с ключом подписки 0…
1 ответ

Двоичный файл для base64 nodejs

Я получаю двоичный аудиофайл при вызове api tts.speech.microsoft.com и хочу преобразовать этот двоичный файл в строку base64. Я пробовал много вещей, например: Buffer.from(body, "binary").toString("base64"); не работает. Я не уверен, что "бинарный" …
29 янв '19 в 14:48
0 ответов

LUIS: Речь SDK - Github Sample не возвращает намерение

Я пытаюсь запустить образец учебника-распознавания речи с последним SDK Я могу вызвать SDK и распознать речь, однако она не возвращает правильное намерение. вместо этого он всегда попадает в result.Reason == ResultReason.RecognizedSpeech Однако, ког…
14 ноя '18 в 15:42
1 ответ

Как использовать речевые службы Azure (TTS) более 1024 символов?

Я использую Azure Bing TTS для какой-то математической диктовки. Между номерами много пауз. например: Exercise number 1. <prosody rate="default" contour="(80%,+20%) (90%,-50%)"> 1 <break time="600ms" /> 2 <break time="600ms" /> 36 …
0 ответов

Botframework эмулятор языка речи

Я хочу использовать речь к тексту в эмуляторе Botframework. Я добавил "fr-FR" в поле "locale" сразу после идентификатора и пароля моего приложения microsft. Речь к тексту прекрасно работает, но не понимает по-французски. Только английский. Что я дол…
2 ответа

Язык API Azure Speech

Я реализовал чат на веб-странице с возможностью использовать функцию "Речь в текст" с помощью Azure Speech API. Это работает нормально, но я не понимаю, где я могу установить язык, понятный API. Я хочу, чтобы он понимал по-французски, но когда я гов…
0 ответов

Работает ли класс PhraseListGrammar из Azure "Речевой сервис" только при использовании американского английского в качестве языка распознавания речи?

Я настраиваю приложение для Android с использованием Unity, где я хочу применить речь к текстовым функциям, для этого я использую SDK Speech-Service Azure. Проблема в том, что, когда я говорю слово, распознаватель пытается угадать слово, а не даже у…
2 ответа

Azure Cognitive Services - API пакетной транскрипции отвечает сообщением об ошибке "URI записи недействителен".

Шаги последовали: Я создал речевой сервис в Западной Америке. У меня есть правильные заголовки(Content-Type and Ocp-Apim-Subscription-Key) Я делаю POST-запрос к https://westus.cris.ai/api/speechtotext/v2.0/transcriptions/ с полезной нагрузкой запрос…
1 ответ

Как использовать API пакетной транскрипции через Python

Я создал службу пакетной транскрипции Azure, которая будет принимать аудиофайл из хранилища BLOB-объектов Azure в качестве входных данных и делиться со мной речью в текст. Я могу достичь вышеизложенного, используя веб-сайт https://eastus.cris.ai/swa…
04 апр '19 в 09:48