Может ли диаризация динамика Google Speech API пометить общего говорящего в нескольких аудиофайлах?

Предположим, у меня есть отдельные записи звонков в службу поддержки. Как правило, в звонке участвует член службы поддержки из небольшого известного пула людей и звонит гораздо большая группа людей. Я могу использовать функции диаризации звонков API Google Speech для расшифровки этих звонков и затем разделите их на каналы, относящиеся к отдельным выступающим во время вызова. Я хотел бы начать маркировать эти каналы, идентифицируя сотрудников службы поддержки и других лиц. Хотя я могу подойти к этому эвристически, мне было интересно, сможет ли API сделать это за меня.

Я еще ничего не пробовал, кроме успешного выполнения диаризации речи по отдельным звонкам.

0 ответов

Другие вопросы по тегам