Как использовать конкретную языковую модель для UDPipe

Question

Как использовать конкретную языковую модель для UDPipe

Я хочу пометить несколько текстовых файлов с помощью программного обеспечения UDPipe ( http://ufal.mff.cuni.cz/udpipe).

Я скачал двоичные пакеты UDPipe, удалось установить все зависимости, я запустил make в src папку, как указано в руководстве по установке ( http://ufal.mff.cuni.cz/udpipe/install), и попытался запустить "самую распространенную" команду UDPipe, а именно:

udpipe --tokenize --tag --parse udpipe_model,

Для этого я скачал русскоязычную модель ( https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2898) и использовал коммана так:

./udpipe --tokenize --tag --parse russian-syntagrus-ud-2.3-181115.udpipe test_input/*.txt,

Я должен сказать, что Руководство пользователя по UDPipe не очень ориентировано на новичков (да, я новичок в этом вопросе), и я даже не знаю, возможно ли использование '*.txt' в качестве входного файла / файлов., Тем не менее, вышеприведенная команда вернула это сообщение:

Загрузка модели UDPipe: Невозможно загрузить модель UDPipe 'russian-syntagrus-ud-2.3-181115.udpipe'!

Получив какое-либо сообщение, я понял, что команда может быть в порядке, но что-то не так с пакетом, может быть, или, скорее всего, с тем, как я его использую. Любая помощь будет оценена. Если команда, которую я пытался использовать, чтобы пометить несколько текстов с использованием определенной языковой модели, является какой-либо неправильной, пожалуйста, покажите мне правильный способ работы с этим программным обеспечением.

Я использую Debian 9 (растяжка).

0

pos-tagging debian-stretch udpipe

Источник

user4680977 04 фев '19 в 18:02

0 ответов

Другие вопросы по тегам pos-tagging debian-stretch udpipe