Описание тега mallet
MALLET - это пакет на основе Java для статистической обработки естественного языка, классификации документов, кластеризации, тематического моделирования, извлечения информации и других приложений машинного обучения в текст.
1
ответ
Не удалось открыть файл mallet logging.properties
Я пытаюсь запустить класс ParallelTopicModel из молотка, я использую NetBeans для его компиляции, но когда я запускаю код, я получаю следующее сообщение об ошибке: Не удалось открыть файл cc.mallet.util.MalletLogger resources / logging.properties. В…
17 дек '17 в 16:20
1
ответ
Маллет SimpleTagger Classpath
Я собираюсь использовать Mallet SimpleTagger для маркировки последовательности. Однако у меня есть проблемы с настройкой пути к классам. Как я видел здесь: classpath Я должен быть в состоянии использовать java -cp для установки classpath. Я следовал…
07 окт '13 в 07:40
1
ответ
Работа с целочисленными функциями для CRF в молотке
Я только начинаю использовать класс SimpleTagger в молотке. У меня сложилось впечатление, что он ожидает двоичные функции. Модель, которую я хочу реализовать, имеет положительные целочисленные функции, и мне интересно, как реализовать это в молотке.…
08 ноя '09 в 13:53
1
ответ
Функция typeTopicCounts в разделе, посвященном моделированию реализации mallet API.
Я пытаюсь понять, как тематическая модель LDA реализована в API-интерфейсе. в ParallelTopicModel класс я могу видеть 2D массив int typeTopicCounts который инициализируется в buildInitialTypeTopicCounts() метод через некоторые побитовые операции и по…
21 июн '17 в 11:40
1
ответ
Параллельно вводить данные в молоток
Я пытаюсь построить классификатор текста с помощью молотка. Данные как-то велики, поэтому я ищу способ, если возможно, запустить задачу "импорта" в нескольких потоках, потому что загрузка занимает много времени. Несколько вопросов здесь: Есть ли спо…
28 мар '17 в 20:22
0
ответов
Как получить распределение вероятностей для темы в молотке?
С помощью молотка я могу получить определенное количество тем и их слов. Как я могу убедиться, что тематические слова имеют распределение вероятностей (т.е. сумма к одному)? Например, если я запустил его, как показано ниже, как я могу использовать в…
21 окт '15 в 05:39
1
ответ
Есть ли у молотка графический интерфейс?
Кто-нибудь видел графический интерфейс для Маллета? Спасибо
13 сен '12 в 22:55
1
ответ
Ошибка: не удалось загрузить или найти язык основного класса
Я новичок в Маллет Я установил Маллет на свой компьютер. Я правильно установил путь к классу (я проверил его, напечатав путь к классу) Я хочу выполнить следующую команду mallet import-smvlight file1 file2.mallet Каждый раз, когда я пытаюсь выполнить…
24 сен '12 в 00:58
2
ответа
Тематическая модель молотка - противоречивые результаты с сериализованным файлом
Я тренирую тематическую модель с Маллетом и хочу сериализовать ее для последующего использования. Я запустил его на двух тестовых документах, а затем десериализовал его и запустил загруженную модель на тех же документах, и результаты оказались совер…
10 ноя '14 в 20:15
1
ответ
Как отловить исключение из внешнего jar в Java
Я пытаюсь запустить алгоритм LDA с помощью библиотеки молотка. Когда я пытаюсь запустить LDA с набором параметров, все в порядке, но с другим набором у меня появляется эта ошибка: 09-Oct-2014 23:50:24.354 INFO [http-nio-8084-exec-127] cc.mallet.topi…
09 окт '14 в 21:04
0
ответов
Как удалить апостроф с помощью Regex в моделировании темы LDA?
Я новичок в теме моделирования и начинаю изучать его с помощью молотка в Java. Согласно моим требованиям, я должен принимать документы со строкой []. Итак, код documents.addThruPipe(new StringArrayIterator(data)); topicModel = new ParallelTopicModel…
22 апр '18 в 14:30
0
ответов
Исправление ошибки Index Array Out of Bounds
Поэтому я пытаюсь запустить молоток для моделирования темы. это основной код: public static void main (String[] args) { try { String filePath = "C:\\mallet\\dataskripsi.txt"; // Begin by importing documents from text to feature sequences ArrayList&l…
22 дек '17 в 20:15
0
ответов
Маллет LDA ArrayIndexOutOfBoundsException при обучении модели
Я пытаюсь построить модель с 500 или 1000 тем на наборе данных документов 1M с LDA Маллет. После 60 итераций я получаю ArrayIndexOutOfBoundsException, Сообщение об ошибке, как показано ниже: <60> LL/token: -7.64386 overflow on type 8 java.lang…
23 дек '16 в 15:27
1
ответ
Что такое функция оценки в моделировании темы с использованием библиотеки молотка
Я новичок в моделировании тем и пытаюсь использовать библиотеку Маллета, но у меня есть вопрос. Я использую простую параллельную реализацию LDA, чтобы найти темы для некоторых случаев. Мой вопрос, что такое функция оценки в ParallelTopicModel? У мен…
05 ноя '14 в 23:36
0
ответов
Как установить частоту среза слова перед использованием näive Байеса в молотке?
Как установить частоту среза слова перед использованием näive Байеса в молотке? Можно ли установить минимальную частоту слов в pipelist? Есть ли возможности?
28 мар '18 в 14:44
1
ответ
Как использовать молоток для API моделирования тем
Есть ли здесь кто-нибудь, успешно использующий API-интерфейс для моделирования темы. Мне трудно это понять, даже если я не знаю, как импортировать мой текст в качестве данных. ребята, вы знаете какой-нибудь хороший источник, чтобы узнать о коде? я н…
24 дек '17 в 16:31
0
ответов
Внедрение скрытого распределения Дирихле (LDA)
Кто-нибудь может на самом деле внедрить LDA и получить распространение темы для документов? я пытаюсь реализовать LDA с помощью ошибок получения Маллет
28 июн '17 в 11:01
1
ответ
Получение словосочетания-матрицы из LDA-модели в Mallet
Я рассчитываю оценку модели LDA с помощью Mallet на Java и ищу термин-тема-матрица. Расчет модели и получение темы-документа-матрицы идет хорошо: ParallelTopicModel model = ...; //... estimating the model int numTopics = model.getNumTopics(); int nu…
13 янв '15 в 23:18
1
ответ
Тема моделирования с помощью молотка
Я пытаюсь использовать тему моделирования с Маллетом, но у меня есть вопрос. Как мне узнать, когда мне нужно перестроить модель? Например, у меня есть такое количество документов, которые я сканировал из Интернета, используя моделирование тем, предо…
03 сен '10 в 13:13
1
ответ
Маллет SimpleTagger FileNotFoundException: c:\mallet-2.0.7 (доступ запрещен)
Я попытался запустить Mallet из windows cmd, следуя точно примерам в документации, а также из решения в этом посте. Я продолжаю получать эту ошибку, в чем может быть проблема? c:\>java -cp "C:\mallet-2.0.7\class;C:\mallet-2.0.7\lib\mallet-deps.ja…
26 фев '14 в 15:17