Откройте приложение с помощью распознавания голоса (PocketSphinx)

Я хочу создать приложение для распознавания голоса в Android и запустить его в обслуживании, чтобы я мог использовать его даже без приложения. Поэтому я искал ссылку и нашел в GitHub демонстрационное приложение.

Это сайт https://github.com/ihrupin/SpeechRecognitionService

Я загружаю приложение, а также читаю документацию. Да, он работает нормально, он также работает в службе, но я действительно хочу, например, если я скажу (откройте Facebook), он откроет установленное приложение Facebook.

Я новичок в использовании PocketSphinx.

Это MainActivity

public class MainActivity extends AppCompatActivity {

private static final int PERMISSIONS_REQUEST_RECORD_AUDIO = 1;
private static final String LOG_TAG = MainActivity.class.getSimpleName();

@Override
protected void onCreate(Bundle savedInstanceState) {
    super.onCreate(savedInstanceState);
    setContentView(R.layout.activity_main);

    ((Button)findViewById(R.id.btn)).setOnClickListener(new View.OnClickListener() {
        @Override
        public void onClick(View v) {
            Log.i(LOG_TAG, "onClick");
            int permissionCheck = ContextCompat.checkSelfPermission(getApplicationContext(), Manifest.permission.RECORD_AUDIO);
            if (permissionCheck == PackageManager.PERMISSION_DENIED) {
                ActivityCompat.requestPermissions(MainActivity.this, new String[]{Manifest.permission.RECORD_AUDIO}, PERMISSIONS_REQUEST_RECORD_AUDIO);
                return;
            }
            startService(new Intent(MainActivity.this, VoiceService.class));
        }
    });
}

@Override
public void onRequestPermissionsResult(int requestCode,
                                       String[] permissions, int[] grantResults) {
    super.onRequestPermissionsResult(requestCode, permissions, grantResults);

    if (requestCode == PERMISSIONS_REQUEST_RECORD_AUDIO) {
        if (grantResults.length > 0 && grantResults[0] == PackageManager.PERMISSION_GRANTED) {
            startService(new Intent(MainActivity.this, VoiceService.class));
        } else {
            finish();
        }
    }
}
}

Это мой сервис

public class VoiceService extends Service implements
    RecognitionListener {

private static final String LOG_TAG = VoiceService.class.getSimpleName();



private static final String KWS_SEARCH = "wakeup";


private static final String KEYPHRASE = "lisa";

private SpeechRecognizer recognizer;

@Nullable
@Override
public IBinder onBind(Intent intent) {
    return null;
}

@Override
public int onStartCommand(Intent intent, int flags, int startId) {


    int permissionCheck = ContextCompat.checkSelfPermission(getApplicationContext(), Manifest.permission.RECORD_AUDIO);
    if (permissionCheck == PackageManager.PERMISSION_GRANTED) {
        runRecognizerSetup();
    }
    return super.onStartCommand(intent, flags, startId);
}

private void runRecognizerSetup() {

    new AsyncTask<Void, Void, Exception>() {
        @Override
        protected Exception doInBackground(Void... params) {
            try {
                Assets assets = new Assets(VoiceService.this);
                File assetDir = assets.syncAssets();
                setupRecognizer(assetDir);
            } catch (IOException e) {
                return e;
            }
            return null;
        }

        @Override
        protected void onPostExecute(Exception result) {
            if (result != null) {
                Log.i(LOG_TAG, "Failed to init recognizer ");
            } else {
                switchSearch(KWS_SEARCH);
            }
        }
    }.execute();
}

@Override
public void onDestroy() {
    super.onDestroy();

    if (recognizer != null) {
        recognizer.cancel();
        recognizer.shutdown();
    }
}


@Override
public void onPartialResult(Hypothesis hypothesis) {
    if (hypothesis == null)
        return;

    String text = hypothesis.getHypstr();
    if (text.contains(KEYPHRASE)) {
        Toast.makeText(this, "onPartialResult text=" + text, Toast.LENGTH_SHORT).show();
        switchSearch(KWS_SEARCH);
    }

    Log.i(LOG_TAG, "onPartialResult text=" +text);
}


@Override
public void onResult(Hypothesis hypothesis) {
    if (hypothesis != null) {
        String text = hypothesis.getHypstr();
        Log.i(LOG_TAG, "onResult text=" +text);

    }
}

@Override
public void onBeginningOfSpeech() {
    Log.i(LOG_TAG, "onBeginningOfSpeech");
}


@Override
public void onEndOfSpeech() {
    if (!recognizer.getSearchName().contains(KWS_SEARCH))
        switchSearch(KWS_SEARCH);
    Log.i(LOG_TAG, "onEndOfSpeech");
}

private void switchSearch(String searchName) {
    Log.i(LOG_TAG, "switchSearch searchName = " + searchName);
    recognizer.stop();


    recognizer.startListening(searchName, 10000);
}

private void setupRecognizer(File assetsDir) throws IOException {


    recognizer = SpeechRecognizerSetup.defaultSetup()
            .setAcousticModel(new File(assetsDir, "en-us-ptm"))
            .setDictionary(new File(assetsDir, "cmudict-en-us.dict"))

            .setRawLogDir(assetsDir)
            .setKeywordThreshold(1e-45f)
            .setBoolean("-allphone_ci", true)


            .getRecognizer();
    recognizer.addListener(this);


    recognizer.addKeyphraseSearch(KWS_SEARCH, KEYPHRASE);
}

@Override
public void onError(Exception error) {
    Log.i(LOG_TAG, "onError " + error.getMessage());
}

@Override
public void onTimeout() {
    switchSearch(KWS_SEARCH);
    Log.i(LOG_TAG, "onTimeout");
}
}

Это BootReceiver

public class BootReceiver extends BroadcastReceiver {
private static final String LOG_TAG = BootReceiver.class.getSimpleName();

@Override
public void onReceive(Context context, Intent intent) {
    Log.i(LOG_TAG, "onReceive");
    if(intent.getAction().equals(Intent.ACTION_BOOT_COMPLETED)){
        Log.i(LOG_TAG, "onReceive onBoot");
        context.startService(new Intent(context, VoiceService.class));
    }
}
}

Я исследовал эту тему и обнаружил, что должен изменить грамматику и словарь, но я не знаю, как это сделать. Есть идеи?

1 ответ

Если вы хотите изменить существующий грамматик и хотите добавить свои собственные слова, вы должны немного его изменить. напишите эту строку в вашем методе настройки распознавателя.

распознаватель.addKeyphraseSearch("facebookPhrase", "Открыть Facebook");

Чтобы отредактировать этот пример, вы можете прочитать о на официальном сайте здесь

https://cmusphinx.github.io/wiki/tutoriallm/

Другие вопросы по тегам