Как удалить апостроф с помощью Regex в моделировании темы LDA?
Я новичок в теме моделирования и начинаю изучать его с помощью молотка в Java. Согласно моим требованиям, я должен принимать документы со строкой []. Итак, код
documents.addThruPipe(new StringArrayIterator(data));
topicModel = new ParallelTopicModel(numTopics, 0.1, 0.01);
topicModel.addInstances(documents);
После выполнения некоторые слова с апострофом включаются в результат моей темы. Как я могу удалить их? Заранее спасибо.