Описание тега diarization
0
ответов
определить количество выступающих по системе сегментации
Есть ли система сегментации говорящих в реальном времени и онлайн, такая как датчик или что-то еще, чтобы подсчитать количество выступающих? заранее спасибо
21 мар '21 в 00:07
2
ответа
Python: как выровнять два списка, используя временные метки начала и окончания в элементе
У меня есть два списка, каждый из которых отсортирован и не пересекается с другими элементами: # (word, start_time, end_time) words = [('i', 5.12, 5.23), ('like', 5.24, 5.36), ('you', 5.37, 5.71), ('really', 7.21, 7.51), ('yes', 8.32, 8.54)] # (spea…
03 апр '21 в 03:38
1
ответ
Назначьте кластерные данные ярлыкам
Я хочу провести дневник оратора. Я уже встроил файлы wav во встраиваемые файлы и получил неплохие результаты с кластеризацией. Я хочу пойти дальше. Я хочу, чтобы люди записывали предложение и вставляли его. так что я могу сравнить записанный звук с …
12 апр '21 в 18:11
0
ответов
ДОСТУП К КОРПУСУ NIST
Пожалуйста, как я могу получить доступ к корпусу NIST. заранее спасибо
06 апр '21 в 00:14
0
ответов
Подходы к диаризации французских спикеров [закрыто]
Итак, давая и звуковой файл звонка (может быть от 2 до 5 человек), я хочу провести дневник говорящего, чтобы я знал, когда каждый говорящий говорит, я пробовал Resemblyzer и pyannote, но я не получил хорошего результата! Обратите внимание, что звоно…
14 апр '21 в 14:06
0
ответов
Речь в текст конкретных людей из разговоров
Я новичок в распознавании голоса. Мне интересно создать инструмент, который позволит мне записывать речь конкретного пользователя в разговоре и в шуме. Мне нравится выяснять, существуют ли какие-либо модели глубокого обучения, способные обнаруживать…
03 май '21 в 11:43
1
ответ
torch.hub.load('pyannote/pyannote-audio', 'dia') не работает в локальном
Я использовал этот код в Google Colab, но он не работает, когда я хочу использовать его в локальном OWN_FILE = {'audio': 'file.wav'} pipeline = torch.hub.load('pyannote/pyannote-audio', 'dia') diarization = pipeline(OWN_FILE) Вот предупреждения, кот…
12 май '21 в 19:01
1
ответ
дневник разговоров по телефону с помощью Resemblyzer
У меня есть аудиозаписи телефонных разговоров, я использовал Resemblyzer, он кластеризует звук на основе динамиков. выход , который в основном является словарем, о котором человек говорил, когда (Speaker_label, start_time, end_time) Мне нужно сегмен…
16 июн '21 в 17:43
0
ответов
Диаризация Lium Speaker java.lang.NullPointerException
Я пытаюсь получить дневник для аудиофайла с помощью динамика LIUM, используя приведенную ниже командную строку. Я использовал ссылку на ссылку ниже https://projets-lium.univ-lemans.fr/spkdiarization/quick-start/ java –jar LIUM_SpkDiarization-4.2.jar…
18 июн '21 в 18:40
1
ответ
Модель диаризации спикера в Python
Я ищу модель (на Python) для ведения дневника говорящего (или одновременного ведения дневника говорящего и распознавания речи). Я пробовал использовать библиотеки pyannote и Resemblyzer, но они не работают с моими данными (не распознают разных динам…
18 ноя '21 в 11:21
0
ответов
Может ли диаризация динамика Google Speech API пометить общего говорящего в нескольких аудиофайлах?
Предположим, у меня есть отдельные записи звонков в службу поддержки. Как правило, в звонке участвует член службы поддержки из небольшого известного пула людей и звонит гораздо большая группа людей. Я могу использовать функции диаризации звонков API…
29 мар '22 в 17:59
0
ответов
Предупреждение Pyannote Metrics: «uem» был аппроксимирован объединением экстентов «эталон» и «гипотеза».
Я использую модуль Pyannote Metrics для вычисления DER (коэффициента ошибок диаризации) между двумя файлами RTTM. Для этого я использую классы аннотаций и сегментов pyannote.core. Вот упрощенная версия кода, который я использую: annotation = Annotat…
01 июн '22 в 08:43
1
ответ
как я могу подсчитать количество людей, говорящих в аудиофайле
Я работаю над аудиопроектом. Моя цель — подсчитать количество людей, которые говорят в аудиофайле. Мы можем считать, что мы уже удалили шум из этого аудио (например, если в аудио разговаривают два человека, программа может вернуть 2, если в этом ауд…
24 май '22 в 09:08
0
ответов
Как разделить 1 канал звука на 2 канала?
У меня есть аудиофайл с двумя динамиками на 1 канал. Я хотел бы разделить звук на 2 канала (по одному на динамик). Я думал о разделении на паузы или о более сложных вещах, таких как диаризация говорящего , чтобы, например, обнаруживать разных говоря…
28 апр '22 в 07:54
0
ответов
AttributeError: объект «NoneType» не имеет атрибута «элементы» в пакете диаризации динамика pyannote
При работе с пакетом python pyannote с GitHub (ссылка на учебник -> https://github.com/pyannote/pyannote-audio/blob/develop/tutorials/voice_activity_detection.ipynb) Я получаю следующую ошибку:введите описание изображения здесь Неделю назад препр…
13 июн '22 в 17:33
1
ответ
Эффективная диаризация динамиков
Я запускаю экземпляр виртуальной машины в облаке Google. Моя цель — применить диаризацию говорящего к нескольким файлам .wav, хранящимся в облачных корзинах. Я пробовал следующие альтернативы с последующими проблемами: Диариза динамиков в Google API…
15 фев '23 в 10:17
0
ответов
Извлечение голоса разных говорящих в перекрывающейся речи с помощью pyannote
Я использую Pyannote для диаризации динамиков. Я могу получить время начала и окончания перекрывающейся речи, но не могу разделить голос. Есть ли способ использовать Pyannote для разделения голоса? Если нет, пожалуйста, предложите какой-нибудь спосо…
19 окт '22 в 08:11
0
ответов
Можно ли интегрировать диаризацию речи с глубокой речью?
На онлайн-встрече, такой как Google Meet/Zoom, я хочу обнаружить смену говорящего, а затем расшифровать звук для разных выступающих. Я использую модель Deepspeech для преобразования речи в текст. Я точно настроил модель для английского языка с индий…
17 окт '22 в 07:24
0
ответов
Частота ошибок диаризации и пропущенное обнаружение (python, pyannote)
Я использую pyannote.metrics.diarization.DiarizationErrorRate для расчета DER между эталоном и гипотезой. Мой результат странный: from pyannote.metrics.diarization import DiarizationErrorRate import pprint der = DiarizationErrorRate() der_result = d…
19 июн '22 в 13:47
1
ответ
Сегментация вместо диаризации для оценки количества говорящих
Я использую диаризацию pyannote, чтобы определить количество динамиков в аудио, где количество динамиков не может быть определено заранее. Вот код для определения количества говорящих путем диаризации: from pyannote.audio import Pipeline MY_TOKEN = …
24 мар '23 в 12:50