Использование анализатора зависимостей Stanford CoreNLP с неподдерживаемыми языками
Я пытаюсь обучить анализатор зависимостей CoreNLP на основе NN на турецком языке. Я нашел команду ниже в документации парсера:
Train a parser with CoNLL treebank data: java edu.stanford.nlp.parser.nndep.DependencyParser -trainFile trainPath
-devFile devPath -embedFile wordEmbeddingFile -embeddingSize wordEmbeddingDimensionality -model modelOutputFile.txt.gz
Я не мог точно понять, что такое modelOutputFile. В документации указано, что этот файл написан на этапе обучения. Является ли modelOutputFile предварительно созданным файлом, который я должен создать, или просто пустым файлом, который будет автоматически записан на этапе обучения?
Любая помощь будет оценена, спасибо!
1 ответ
Когда процесс обучения завершен, он должен написать обученную модель modelOutputFile.txt.gz
Затем вы можете использовать этот обученный файл для анализа нового текста. Полная документация здесь: https://nlp.stanford.edu/software/nndep.shtml