Как использовать конкретную языковую модель для UDPipe
Я хочу пометить несколько текстовых файлов с помощью программного обеспечения UDPipe ( http://ufal.mff.cuni.cz/udpipe).
Я скачал двоичные пакеты UDPipe, удалось установить все зависимости, я запустил make
в src
папку, как указано в руководстве по установке ( http://ufal.mff.cuni.cz/udpipe/install), и попытался запустить "самую распространенную" команду UDPipe, а именно:
udpipe --tokenize --tag --parse udpipe_model
,
Для этого я скачал русскоязычную модель ( https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2898) и использовал коммана так:
./udpipe --tokenize --tag --parse russian-syntagrus-ud-2.3-181115.udpipe test_input/*.txt
,
Я должен сказать, что Руководство пользователя по UDPipe не очень ориентировано на новичков (да, я новичок в этом вопросе), и я даже не знаю, возможно ли использование '*.txt' в качестве входного файла / файлов., Тем не менее, вышеприведенная команда вернула это сообщение:
Загрузка модели UDPipe: Невозможно загрузить модель UDPipe 'russian-syntagrus-ud-2.3-181115.udpipe'!
Получив какое-либо сообщение, я понял, что команда может быть в порядке, но что-то не так с пакетом, может быть, или, скорее всего, с тем, как я его использую. Любая помощь будет оценена. Если команда, которую я пытался использовать, чтобы пометить несколько текстов с использованием определенной языковой модели, является какой-либо неправильной, пожалуйста, покажите мне правильный способ работы с этим программным обеспечением.
Я использую Debian 9 (растяжка).