Бесплатное распознавание речи для приложения C# WinForm
Я пытаюсь найти бесплатное распознавание речи для исполняемого файла C# Windows Form Application, который может работать как Google Speech Recognition, распознавать и преобразовывать абсолютно новые слова в текст.
Я пытался использовать System.Speech.Recognition; по-разному, но это хорошо работает для предварительно записанных команд, и я не могу получить такие результаты, так как он работает с Google Speech Recognition, например, с Python, что составляет 95% правильных результатов, по крайней мере, более чем достаточно, чтобы сказать, что это хорошо, но, очевидно, если у меня нет ключа, он не доступен бесплатно и использовать его в исполняемом файле.
Поэтому я хочу попробовать Bing Speech API Microsoft Cognitive Services, но не могу найти ни одного примера, как его кодировать, какой-то базовый пример. Если кто-то имел дело с этим инструментом, вы можете помочь мне разобраться
1 ответ
Привет, может быть, это может помочь вам простой пример API Bing речь, это не winform это для WPF приложения C#
using Microsoft.CognitiveServices.SpeechRecognition;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows;
using System.Windows.Controls;
using System.Windows.Data;
using System.Windows.Documents;
using System.Windows.Input;
using System.Windows.Media;
using System.Windows.Media.Imaging;
using System.Windows.Navigation;
using System.Windows.Shapes;
using Microsoft.ProjectOxford.SpeechRecognition;
using System.Threading;
using System.Configuration;
namespace BingSpeech
{
/// <summary>
/// Interaction logic for MainWindow.xaml
/// </summary>
public partial class MainWindow : Window
{
AutoResetEvent _FinalResponceEvent;
MicrophoneRecognitionClient _microphoneRecognitionClient;
public MainWindow()
{
InitializeComponent();
RecordButton.Content = "Start\nRecording";
_FinalResponceEvent = new AutoResetEvent(false);
OutputTextbox.Background = Brushes.White;
OutputTextbox.Foreground = Brushes.Black;
}
private void RecordButton_Click(object sender, RoutedEventArgs e)
{
RecordButton.Content = "Listening ...";
RecordButton.IsEnabled = false;
OutputTextbox.Background = Brushes.Green;
OutputTextbox.Foreground = Brushes.White;
ConvertSpeechToText();
}
private void ConvertSpeechToText()
{
var speechRecognitionMode = SpeechRecognitionMode.ShortPhrase;
string language = "en-us";
string subscriptionKey = ConfigurationManager.AppSettings["MicrosoftSpeechApiKey"].ToString();
_microphoneRecognitionClient = SpeechRecognitionServiceFactory.CreateMicrophoneClient(
speechRecognitionMode,
language,
subscriptionKey
);
_microphoneRecognitionClient.OnPartialResponseReceived += OnPartialResponseReceivedHandler;
_microphoneRecognitionClient.OnResponseReceived += OnMicShortPhraseResponceReceivedHandler;
_microphoneRecognitionClient.StartMicAndRecognition();
}
private void OnPartialResponseReceivedHandler(object sender, PartialSpeechResponseEventArgs e)
{
string result = e.PartialResult;
jarvis.SpeakAsync(e.PartialResult);
Dispatcher.Invoke(() =>
{
OutputTextbox.Text = (e.PartialResult);
OutputTextbox.Text += ("\n");
});
}
private void OnMicShortPhraseResponceReceivedHandler(object sender, SpeechResponseEventArgs e)
{
Dispatcher.Invoke((Action)(() =>
{
_FinalResponceEvent.Set();
_microphoneRecognitionClient.EndMicAndRecognition();
_microphoneRecognitionClient.Dispose();
_microphoneRecognitionClient = null;
RecordButton.Content = "Start\nRecording";
RecordButton.IsEnabled = true;
OutputTextbox.Background = Brushes.White;
OutputTextbox.Foreground = Brushes.Black;
}));
}
}
}