Android TensorFlow распознавание голоса конкретного человека

Привет, я начинаю с tenoflow для Android, и моя цель - узнать, что говорит конкретный человек, определить, например, время начала разговора с человеком "А", вместо этого, если человек "А" замолчал, а человек "Б" говорит, это игнорируется

Итак, я прочитал этот документ, но, кажется, пример указывает на то, что он распознает речь определенных слов, таких как "влево", "вправо", "вверх"... но не обращает внимания на то, кто был говорящим человеком.

В качестве идеи я прочитал, что для предоставленной демоверсии TensorFlow подается с разными голосовыми базами данных для получения моделирования. Что, если бы я мог предоставить большую папку этого конкретного человека, говорящего, чтобы узнать его речь? Или это безумная идея?

РЕДАКТИРОВАТЬ: в качестве отправной точки я прочитал эту статью, которая, кажется, связана с моей целью

Я хотел бы получить доступ к некоторому коду для включения в мой проект. Благодарю.

0 ответов

Другие вопросы по тегам