Система статистического машинного перевода.
1 ответ

Как указать пользовательский каталог надстройки для mgiza для Моисея?

Я скачал mosesdecoder и успешно скомпилировал его. Поскольку было несколько ошибок повышения с разницей в версиях, я установил повышение в пользовательском каталоге. Я пытаюсь установить mgiza с кастомной буст-установкой. На странице дополнительных …
05 авг '16 в 11:59
0 ответов

Изменить moses.ini для дополнительного обучения

Мне нужно обновить следующий файл moses.ini для поддержки инкрементального обучения, я следовал руководству и обнаружил, что должен добавить эту строку в файл moses.ini PhraseDictionaryDynSuffixArray source=<path-to-source-corpus> target=<p…
06 фев '14 в 00:28
1 ответ

Неопределенная ссылка на `gzopen'в Моисее

В настоящее время я пытаюсь установить скрипт moses, являющийся частью инструмента машинного перевода moses, но получаю сообщение об ошибке: /home/moses/scripts/training/lexical-reordering/reordering_classes.cpp:349: undefined reference to `gzopen' …
24 ноя '11 в 15:35
0 ответов

Ошибка скрипта moses train-model.perl, коэффициент --lm: порядок: имя файла обязательно

Когда я бегу: $MOSES/scripts/training/train-model.perl -hierarchical -ghkm -external-bin-dir /home/zhanwang/giza-pp/tools/ -root-dir . --corpus corpus/nl2mr --f mr --e nl показал: ОШИБКА: используйте --lm factor:order: имя файла, чтобы указать по кр…
26 мар '16 в 13:06
1 ответ

Сбой вызова метода перевода в Моисее как службе, использующей xml-rpc

Я сталкиваюсь с исключением, вызывающим moses (Статистический машинный перевод) как службу с установленным xmlrpc. Я сначала открываю порт для сервера Моисея --Listening on port 8082 но главная проблема - когда я отправляю запрос на отдых с параметр…
14 июн '18 в 14:51
1 ответ

Как настроить модель машинного перевода с огромной языковой моделью?

Moses программное обеспечение для построения моделей машинного перевода А также KenLM это программное обеспечение де-факто языковой модели, которое использует Моисей. У меня есть текстовый файл с 16 ГБ текста, и я использую его для построения языков…
0 ответов

Современный инструментарий языкового перевода

Мне нужно перевести испанские твиты на английский для моего исследования. Я нахожу некоторый инструментарий. Среди них Моисей используется в некоторых исследовательских работах, а другие новые наборы инструментов используют их в качестве основы для …
19 дек '16 в 23:00
1 ответ

Почему такая плохая производительность для Моисея, использующего Europarl?

Я начал играть с Моисеем и пытался сделать то, что, по моему мнению, было бы достаточно стандартной базовой системой. Я в основном следовал шагам, описанным на сайте, но вместо того, чтобы использовать news-commentary Я использовал Europarl v7 для о…
06 май '15 в 20:50
0 ответов

Набор новостей WMT'15: форматирование.sgm

Какие сценарии используются (и как?) Для получения наборов данных для тестирования новостей из wmt из формата.sgm в неформатированный формат (например, набор данных europarl)? например, набор данных для тестирования новостей, загруженный по адресу: …
11 июн '16 в 16:34
1 ответ

Что из перечисленного будет лучшим набором данных для обучения и настройки Моисея?

Я пытаюсь создать систему перевода с тамильского на английский, используя Моисея. https://github.com/joshua-decoder/indian-parallel-corpora/tree/master/ta-en - мой источник данных для параллельного корпуса. Файлы dict имеют длину около 70 тыс. Строк…
13 фев '14 в 09:43
1 ответ

Что означает ($pre =~ /\./ && $pre =~ /\p{IsAlpha}/) в Moken Tokenizer?

Moses Tokenizer - это токенизатор, широко используемый в экспериментах по машинному переводу и обработке естественного языка. Существует строка регулярного выражения, которая проверяет: if (($pre =~ /\./ && $pre =~ /\p{IsAlpha}/) || ($NONBR…
09 фев '17 в 01:55
4 ответа

Нужно разбить строку Unicode

Я использую набор инструментов Моисея для моей системы перевода. Я использую ассамский и английский параллельный корпус и обучаю их. Но некоторые собственные существительные не переводятся. Это потому, что у меня очень маленький корпус (параллельный…
19 дек '13 в 16:00
0 ответов

Я прервал операцию клона. Как я могу клонировать снова без ошибок?

Я побежал git clone https://github.com/moses-smt/mosesdecoder.git а затем нажал Ctrl + C. Затем я попытался снова клонировать, но я получил следующую ошибку: fatal: destination path 'mosesdecoder' already exists and is not an empty directory Как я м…
28 сен '14 в 09:50
0 ответов

Токенизатор в системе moses-SMT застрял даже с 10 предложениями

Я пытался сделать базовую систему MT. Просто для проверки того, как это работает, я сделал корпус языка Source (S) и Target (T) всего из 2000 предложений. Самым первым шагом является подготовка данных для системы машинного перевода (MT). На этом эта…
16 окт '16 в 15:28
1 ответ

Разница между токенизированным и обычным текстом в Python NLTK

Я использую токенайзер WordPunct для токенизации этого предложения: في_بيتنا كل شي لما تحتاجه يضيع... ادور على شاحن فجأة يختفي..لدرجة اني اسوي نفسي ادور شيء Мой код: import re import nltk sentence= " في_بيتنا كل شي لما تحتاجه يضيع ...ادور على شاحن ف…
18 июл '13 в 16:29
2 ответа

Ошибка при попытке выборочных моделей Моисея

После успешной установки moses на моем ноутбуке (Ubuntu13.04) я пытаюсь запустить примеры моделей ( Запускаю moses впервые). Я wget sample-models.tgz и распаковываю его в папку. И затем выполните команду: ~/mosesdecoder/bin/moses -f phrase-model/mos…
22 апр '14 в 10:06
0 ответов

Трудность перевода SMT в Moses при создании модели (с немецкого на английский) из двух параллельных наборов файлов

Я пытаюсь создать модель в Moses SMT из двух параллельных языковых файлов. Я завершил все этапы создания модели. Но когда я запускаю перевод: эхо "Ум зу бестиммен" | ~/mosesdecoder/bin/moses -f ~/mosesdecoder/0_my_test/align_2016.08.19_14.24.05/mode…
21 авг '16 в 12:17
1 ответ

Тренировочные данные Моисея-Корпус

В настоящее время я новичок в Моисее и обучил несколько образцов данных, представленных на веб-сайтах. Я ищу больше наборов данных для обучения системы. Доступны ли они онлайн? Что я должен смотреть при поиске в Google?
08 апр '15 в 12:14
1 ответ

Запуск сервера Моисея на Амазоне

Я пытаюсь запустить сервер moses на экземпляре Amazon ec2, поддерживаемом ebs. Языковые модели и модели перевода в общей сложности около 200 ГБ. Я думаю, что у меня установлен инстанс moses, который загружает языковые модели и модели перевода, храня…
1 ответ

Что означают цифры в фразе-таблице giza++?

Я искал значение чисел в выводе таблицы фраз giza++ на официальном сайте (и в руководстве в формате pdf): http://www.statmt.org/moses/?n=FactoredTraining.ScorePhrases И это то, к чему я пришел. Допустим, это строка из фразы načiniti na koji ||| way …
18 сен '17 в 16:48