deeplearning4j: онлайн обучение Word2Vec
Word2vec
отличный инструмент deeplearning4j. Мне удалось создать вектор для корпуса после этого урока.
Теперь вопрос состоит в том, как обновить модель новыми предложениями, не перестраивая ее заново.
Некоторые мысли по этому поводу, поможет ли этот метод?
public void trainSentence(List<VocabWord> sentence){}
Будет ли это обновить модель? Если да, то как подготовить предложение для отправки по этому методу?
1 ответ
И да и нет. В документации здесь упоминается:
Добавлено обновление весов после сериализации / десериализации модели. То есть вы можете обновить состояние модели, скажем, 200 ГБ нового текста, вызвав
loadFullModel
, добавивTokenizerFactory
а такжеSentenceIterator
к нему, и зоветfit()
на восстановленной модели.
Это означает, что веса моделей могут быть переобучены и обновлены с новым корпусом. Но никакие новые слова не будут добавлены в словарь.
Проверьте код и Javadoc здесь.