Использование анализатора зависимостей Stanford CoreNLP с неподдерживаемыми языками

Question

Использование анализатора зависимостей Stanford CoreNLP с неподдерживаемыми языками

Я пытаюсь обучить анализатор зависимостей CoreNLP на основе NN на турецком языке. Я нашел команду ниже в документации парсера:

Train a parser with CoNLL treebank data: java    edu.stanford.nlp.parser.nndep.DependencyParser -trainFile trainPath
-devFile devPath -embedFile wordEmbeddingFile -embeddingSize wordEmbeddingDimensionality -model modelOutputFile.txt.gz

Я не мог точно понять, что такое modelOutputFile. В документации указано, что этот файл написан на этапе обучения. Является ли modelOutputFile предварительно созданным файлом, который я должен создать, или просто пустым файлом, который будет автоматически записан на этапе обучения?

Любая помощь будет оценена, спасибо!

1

nlp stanford-nlp dependency-parsing

Источник

user8875627 02 ноя '17 в 15:47

1 ответ

Другие вопросы по тегам nlp stanford-nlp dependency-parsing

user4793732 02 ноя '17 в 20:04 2017-11-02 20:04 · Answer 1 · 2017-11-02 20:04

Когда процесс обучения завершен, он должен написать обученную модель modelOutputFile.txt.gz Затем вы можете использовать этот обученный файл для анализа нового текста. Полная документация здесь: https://nlp.stanford.edu/software/nndep.shtml

1

Источник

user4793732 02 ноя '17 в 20:04