Использование анализатора зависимостей Stanford CoreNLP с неподдерживаемыми языками

Я пытаюсь обучить анализатор зависимостей CoreNLP на основе NN на турецком языке. Я нашел команду ниже в документации парсера:

Train a parser with CoNLL treebank data: java    edu.stanford.nlp.parser.nndep.DependencyParser -trainFile trainPath
-devFile devPath -embedFile wordEmbeddingFile -embeddingSize wordEmbeddingDimensionality -model modelOutputFile.txt.gz

Я не мог точно понять, что такое modelOutputFile. В документации указано, что этот файл написан на этапе обучения. Является ли modelOutputFile предварительно созданным файлом, который я должен создать, или просто пустым файлом, который будет автоматически записан на этапе обучения?

Любая помощь будет оценена, спасибо!

1 ответ

Когда процесс обучения завершен, он должен написать обученную модель modelOutputFile.txt.gz Затем вы можете использовать этот обученный файл для анализа нового текста. Полная документация здесь: https://nlp.stanford.edu/software/nndep.shtml

Другие вопросы по тегам