Возникла проблема при вызове функции AudioConfig.FromWavFileInput через библиотеку python

Question

Возникла проблема при вызове функции AudioConfig.FromWavFileInput через библиотеку python

Я пытаюсь обработать файл.wav с помощью службы когнитивной речи Azure. Я использую скрипт ниже. Я получаю исключение, которое говорит, что "объект типа" AudioConfig "не имеет атрибута" FromWavFileInput "", когда я пытаюсь настроить файл wav, вызывая AudioConfig.FromWavFileInput (). В документации сказано, что функция существует, по крайней мере, в библиотеке.net. Существует ли FromWaveFileInput для библиотеки Python cognitiveservices-speech? Как я могу обработать аудиофайл с помощью Python?

import azure.cognitiveservices.speech as speechsdk

speechKey = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
service_region = 'eastus2'

#### # Creates an instance of a speech config with specified subscription key and service region.
#### # Replace with your own subscription key and service region (e.g., "westus").
speech_config = speechsdk.SpeechConfig(subscription=speechKey, region=service_region)

audioInput = speechsdk.AudioConfig.FromWavFileInput('RainSpain.wav')

#### # Creates a recognizer with the given settings
speech_recognizer = speechsdk.SpeechRecognizer(speech_config=speech_config, audio_input=audioInput)

0

python azure speech-recognition azure-machine-learning-studio azure-machine-learning

Источник

user4954801 27 дек '18 в 23:47

1 ответ

Другие вопросы по тегам python azure speech-recognition azure-machine-learning-studio azure-machine-learning

user7130613 11 июн '20 в 13:00 2020-06-11 13:00 · Answer 1 · 2020-06-11 13:00

Это работает как шарм

audio_filename = "something.wav"
audio_input =speechsdk.audio.AudioConfig(filename=audio_filename)

1

Источник

user7130613 11 июн '20 в 13:00

user4989676 31 дек '18 в 09:44 2018-12-31 09:44 · Answer 2 · 2018-12-31 09:44

Действительно, как вы сказали. Я искал ключевые слова AudioConfig & FromWavFileInput на GitHub репо Azure-Samples/cognitive-services-speech-sdk, нет никаких кодов Python об этом, за исключением Java, C# и C++.

По моему опыту, есть два обходных пути сделать это.

Оберните коды C++ как модуль расширения Python или общайтесь с кодами C++/Java.
Непосредственное использование REST API службы Speech с requests это просто для Python и Azure Speech Service.