Sk-Learn LDA для извлечения темы, недоумения и оценки

Всем привет!

Помимо проекта, мне нужно создать классификатор текста с помеченными данными, которые у меня есть. Точка данных состоит из одного предложения и одной из 3 категорий для каждого предложения. Я извлек 5 тем из этой базы данных с LDA.

Я хочу попробовать использовать эти темы, чтобы определить, к какому классу относится невидимое предложение. Я подумываю о тренировке контролируемой модели с 5 индикаторами, которые показывают распределение тем для предложения с учетом этих 5 тем.

Проблема в том, что я не могу получить отдельную вероятность для каждой темы с учетом предложения. Я запутался в том, что указывает на недоумение и оценку модели LDA. Кажется, они возвращают значение с плавающей запятой.

Кроме того, я знаю о контролируемых версиях LDA. Я хочу знать, имеет ли смысл мой подход вообще.

Заранее спасибо!

0 ответов

Другие вопросы по тегам