Описание тега mallet

MALLET - это пакет на основе Java для статистической обработки естественного языка, классификации документов, кластеризации, тематического моделирования, извлечения информации и других приложений машинного обучения в текст.
1 ответ

Не удалось открыть файл mallet logging.properties

Я пытаюсь запустить класс ParallelTopicModel из молотка, я использую NetBeans для его компиляции, но когда я запускаю код, я получаю следующее сообщение об ошибке: Не удалось открыть файл cc.mallet.util.MalletLogger resources / logging.properties. В…
17 дек '17 в 16:20
1 ответ

Маллет SimpleTagger Classpath

Я собираюсь использовать Mallet SimpleTagger для маркировки последовательности. Однако у меня есть проблемы с настройкой пути к классам. Как я видел здесь: classpath Я должен быть в состоянии использовать java -cp для установки classpath. Я следовал…
07 окт '13 в 07:40
1 ответ

Работа с целочисленными функциями для CRF в молотке

Я только начинаю использовать класс SimpleTagger в молотке. У меня сложилось впечатление, что он ожидает двоичные функции. Модель, которую я хочу реализовать, имеет положительные целочисленные функции, и мне интересно, как реализовать это в молотке.…
08 ноя '09 в 13:53
1 ответ

Функция typeTopicCounts в разделе, посвященном моделированию реализации mallet API.

Я пытаюсь понять, как тематическая модель LDA реализована в API-интерфейсе. в ParallelTopicModel класс я могу видеть 2D массив int typeTopicCounts который инициализируется в buildInitialTypeTopicCounts() метод через некоторые побитовые операции и по…
21 июн '17 в 11:40
1 ответ

Параллельно вводить данные в молоток

Я пытаюсь построить классификатор текста с помощью молотка. Данные как-то велики, поэтому я ищу способ, если возможно, запустить задачу "импорта" в нескольких потоках, потому что загрузка занимает много времени. Несколько вопросов здесь: Есть ли спо…
0 ответов

Как получить распределение вероятностей для темы в молотке?

С помощью молотка я могу получить определенное количество тем и их слов. Как я могу убедиться, что тематические слова имеют распределение вероятностей (т.е. сумма к одному)? Например, если я запустил его, как показано ниже, как я могу использовать в…
1 ответ

Есть ли у молотка графический интерфейс?

Кто-нибудь видел графический интерфейс для Маллета? Спасибо
1 ответ

Ошибка: не удалось загрузить или найти язык основного класса

Я новичок в Маллет Я установил Маллет на свой компьютер. Я правильно установил путь к классу (я проверил его, напечатав путь к классу) Я хочу выполнить следующую команду mallet import-smvlight file1 file2.mallet Каждый раз, когда я пытаюсь выполнить…
24 сен '12 в 00:58
2 ответа

Тематическая модель молотка - противоречивые результаты с сериализованным файлом

Я тренирую тематическую модель с Маллетом и хочу сериализовать ее для последующего использования. Я запустил его на двух тестовых документах, а затем десериализовал его и запустил загруженную модель на тех же документах, и результаты оказались совер…
10 ноя '14 в 20:15
1 ответ

Как отловить исключение из внешнего jar в Java

Я пытаюсь запустить алгоритм LDA с помощью библиотеки молотка. Когда я пытаюсь запустить LDA с набором параметров, все в порядке, но с другим набором у меня появляется эта ошибка: 09-Oct-2014 23:50:24.354 INFO [http-nio-8084-exec-127] cc.mallet.topi…
09 окт '14 в 21:04
0 ответов

Как удалить апостроф с помощью Regex в моделировании темы LDA?

Я новичок в теме моделирования и начинаю изучать его с помощью молотка в Java. Согласно моим требованиям, я должен принимать документы со строкой []. Итак, код documents.addThruPipe(new StringArrayIterator(data)); topicModel = new ParallelTopicModel…
22 апр '18 в 14:30
0 ответов

Исправление ошибки Index Array Out of Bounds

Поэтому я пытаюсь запустить молоток для моделирования темы. это основной код: public static void main (String[] args) { try { String filePath = "C:\\mallet\\dataskripsi.txt"; // Begin by importing documents from text to feature sequences ArrayList&l…
22 дек '17 в 20:15
0 ответов

Маллет LDA ArrayIndexOutOfBoundsException при обучении модели

Я пытаюсь построить модель с 500 или 1000 тем на наборе данных документов 1M с LDA Маллет. После 60 итераций я получаю ArrayIndexOutOfBoundsException, Сообщение об ошибке, как показано ниже: <60> LL/token: -7.64386 overflow on type 8 java.lang…
23 дек '16 в 15:27
1 ответ

Что такое функция оценки в моделировании темы с использованием библиотеки молотка

Я новичок в моделировании тем и пытаюсь использовать библиотеку Маллета, но у меня есть вопрос. Я использую простую параллельную реализацию LDA, чтобы найти темы для некоторых случаев. Мой вопрос, что такое функция оценки в ParallelTopicModel? У мен…
05 ноя '14 в 23:36
0 ответов

Как установить частоту среза слова перед использованием näive Байеса в молотке?

Как установить частоту среза слова перед использованием näive Байеса в молотке? Можно ли установить минимальную частоту слов в pipelist? Есть ли возможности?
28 мар '18 в 14:44
1 ответ

Как использовать молоток для API моделирования тем

Есть ли здесь кто-нибудь, успешно использующий API-интерфейс для моделирования темы. Мне трудно это понять, даже если я не знаю, как импортировать мой текст в качестве данных. ребята, вы знаете какой-нибудь хороший источник, чтобы узнать о коде? я н…
24 дек '17 в 16:31
0 ответов

Внедрение скрытого распределения Дирихле (LDA)

Кто-нибудь может на самом деле внедрить LDA и получить распространение темы для документов? я пытаюсь реализовать LDA с помощью ошибок получения Маллет
28 июн '17 в 11:01
1 ответ

Получение словосочетания-матрицы из LDA-модели в Mallet

Я рассчитываю оценку модели LDA с помощью Mallet на Java и ищу термин-тема-матрица. Расчет модели и получение темы-документа-матрицы идет хорошо: ParallelTopicModel model = ...; //... estimating the model int numTopics = model.getNumTopics(); int nu…
13 янв '15 в 23:18
1 ответ

Тема моделирования с помощью молотка

Я пытаюсь использовать тему моделирования с Маллетом, но у меня есть вопрос. Как мне узнать, когда мне нужно перестроить модель? Например, у меня есть такое количество документов, которые я сканировал из Интернета, используя моделирование тем, предо…
03 сен '10 в 13:13
1 ответ

Маллет SimpleTagger FileNotFoundException: c:\mallet-2.0.7 (доступ запрещен)

Я попытался запустить Mallet из windows cmd, следуя точно примерам в документации, а также из решения в этом посте. Я продолжаю получать эту ошибку, в чем может быть проблема? c:\>java -cp "C:\mallet-2.0.7\class;C:\mallet-2.0.7\lib\mallet-deps.ja…
26 фев '14 в 15:17