Как удалить апостроф с помощью Regex в моделировании темы LDA?

Я новичок в теме моделирования и начинаю изучать его с помощью молотка в Java. Согласно моим требованиям, я должен принимать документы со строкой []. Итак, код

documents.addThruPipe(new StringArrayIterator(data));
topicModel = new ParallelTopicModel(numTopics, 0.1, 0.01);
topicModel.addInstances(documents);

После выполнения некоторые слова с апострофом включаются в результат моей темы. Как я могу удалить их? Заранее спасибо.

0 ответов

Другие вопросы по тегам