Почему Stanford Topic Modeling Toolbox не создает каталог lda-output?
Я попытался запустить этот код из github (после 1-2-3 шагов), который определяет 30 тем в 14 500 электронных письмах Сары Пэйлин. Открытые автором темы находятся здесь. Тем не менее, Stanford Topic Modeling Toolbox не производит каталог lda-output для меня. Он создал lda-86a58136-30-2b1a90a6, но файл summary.txt в этой папке показывает только начальное назначение тем, а не окончательное. Любая идея, как создать каталог lda-output с окончательным обзором обнаруженных тем? Заранее спасибо!
1 ответ
Вы пробовали инструкции, размещенные здесь?
Обратите внимание, что я вижу, что оригинальный следователь обучил модель письмам Сары Пэйлин, а затем использовал эту обученную модель для анализа писем Сары Пэйлин. Хотя я не эксперт по LDA, это, как правило, похоже на "поиск того, что у вас есть".
В большинстве дисциплин обучение будет проводиться по известному набору предметов, которые были классифицированы экспертами в соответствии с дискриминацией. Это означает, что обучение будет состоять из подачи набора данных в известных вероятных темах из других источников, а затем будет использовать библиотеку LDA для определения расстояния от тем в "изученной" базе данных.
В любом случае, удачи.
Если вы столкнулись с определенной проблемой, пожалуйста, опубликуйте сообщение об ошибке, и шаги, которые вы предприняли, чтобы прийти к этой ошибке. Мало кто тратит время на то, чтобы попытаться воспроизвести проблему (типичная предпосылка для исправления проблемы) без указания направления или даже на способность определить, похожа ли ваша возникшая проблема на вашу.