iOS Swift SpeechKit: как определить конец речи

iOS 11.2 Xcode 9.2

Я интегрирую SpeechKit в приложение для голосовых транзакций. Я использую SpeechKit с распознавателем для распознавания речи. Тем не менее, я не получаю окончательный результат, который можно назвать КОНЕЦ РЕЧИ. Ниже приведен код, который я использую для функции речи в текст. Любая помощь очень ценится для определения конца речи.

func startRecording () {

    if recognitionTask != nil {  //1
        recognitionTask?.cancel()
        recognitionTask = nil
    }

    let audioSession = AVAudioSession.sharedInstance()  //2
    do {
        try audioSession.setCategory(AVAudioSessionCategoryRecord)
        try audioSession.setMode(AVAudioSessionModeMeasurement)
        try audioSession.setActive(true, with: .notifyOthersOnDeactivation)
    } catch {
        print("audioSession properties weren't set because of an error.")
    }

    recognitionRequest = SFSpeechAudioBufferRecognitionRequest()  //3

    guard let inputNode = audioEngine.inputNode else {
        fatalError("Audio engine has no input node")
    }  //4

    guard let recognitionRequest = recognitionRequest else {
        fatalError("Unable to create an SFSpeechAudioBufferRecognitionRequest object")
    } //5

    recognitionRequest.shouldReportPartialResults = true  //6

    recognitionTask = speechRecognizer.recognitionTask(with: recognitionRequest, resultHandler: { (result, error) in  //7

        var isFinal = false  //8

        if result != nil {
            print(result?.bestTranscription.formattedString)
            self.textView.text = result?.bestTranscription.formattedString  //9
            isFinal = (result?.isFinal)!
        }

        if error != nil || isFinal {  //10
            self.audioEngine.stop()
            inputNode.removeTap(onBus: 0)

            self.recognitionRequest = nil
            self.recognitionTask = nil

            self.microphoneButton.isEnabled = true
        }
    })

    let recordingFormat = inputNode.outputFormat(forBus: 0)  //11
    inputNode.installTap(onBus: 0, bufferSize: 1024, format: recordingFormat) { (buffer, when) in
        self.recognitionRequest?.append(buffer)
    }

    audioEngine.prepare()  //12

    do {
        try audioEngine.start()
    } catch {
        print("audioEngine couldn't start because of an error.")
    }

    textView.text = "Say something, I'm listening!"

}

0 ответов

Другие вопросы по тегам