Может ли диаризация динамика Google Speech API пометить общего говорящего в нескольких аудиофайлах?
Предположим, у меня есть отдельные записи звонков в службу поддержки. Как правило, в звонке участвует член службы поддержки из небольшого известного пула людей и звонит гораздо большая группа людей. Я могу использовать функции диаризации звонков API Google Speech для расшифровки этих звонков и затем разделите их на каналы, относящиеся к отдельным выступающим во время вызова. Я хотел бы начать маркировать эти каналы, идентифицируя сотрудников службы поддержки и других лиц. Хотя я могу подойти к этому эвристически, мне было интересно, сможет ли API сделать это за меня.
Я еще ничего не пробовал, кроме успешного выполнения диаризации речи по отдельным звонкам.