Описание тега machine-translation

Машинный перевод, подраздел обработки естественного языка, представляет собой автоматический перевод человеческих языков. В то время как исторические переводчики основаны на статистическом машинном переводе, новые системы используют нейронные сети, которые обеспечивают гораздо лучшие результаты.
4 ответа

Как сохранить модели выравнивания Python NLTK для последующего использования?

В Python я использую NLTK's alignment module создавать выравнивания слов между параллельными текстами. Выравнивание кусков может быть трудоемким процессом, особенно когда выполняется над значительными корпусами. Было бы неплохо сделать выравнивания …
12 май '15 в 15:25
1 ответ

Seq2Seq с пониманием Кераса

Для самообучения я пытаюсь реализовать простую модель последовательность-последовательность с использованием Keras. Хотя я понял основную идею и в Интернете есть несколько учебных пособий, я все еще борюсь с некоторыми основными концепциями, когда с…
2 ответа

Инструмент для преобразования текста в аудио

Существуют ли какие-либо инструменты, которые преобразуют образец текста (скажем, "Hello World") в аудио на лету для конечного пользователя. (Примечание: текст, который нужно преобразовать, будет извлечен из базы данных и показан конечному пользоват…
0 ответов

Уровень слова Seq2Seq с Керасом

Я следовал учебному пособию Keras Seq2Seq, и остроумие работает отлично. Однако это модель уровня персонажа, и я хотел бы перенести ее на модель уровня слова. Авторы даже включают абзац с необходимыми изменениями, но все мои текущие попытки приводят…
0 ответов

Как получить результаты модели IBM 1/2, используя giza++

Кажется, нигде не найдено хорошего руководства по использованию инструмента выравнивания слов GIZA++. Все веб-сайты демонстрируют простое руководство по запуску GIZA++ word-aligner. Я запустил на основе этих руководств и получил выходные файлы, как …
17 янв '18 в 17:17
1 ответ

Как декодировать вывод seq2seq?

Код из примера Tensorflow translate.py меня смутил. Скопированный код: # This is a greedy decoder - outputs are just argmaxes of output_logits. outputs = [int(np.argmax(logit, axis=1)) for logit in output_logits] Почему argmax Работа? output_logits …
0 ответов

Как ускорить шаг mkcls в mgiza++ или giza++, это отнимает много времени для кластеризации слов?

Я использую MGIZA++ для выравнивания слов по кусочкам из параллельного корпуса Организации Объединенных Наций。 Перед обучением модели выравнивания с использованием MGIZA++ мне нужно использовать mkcls скрипт для создания классов, необходимых для алг…
0 ответов

Поведение Tensorflow's GreedyEmbeddingHelper

Я использую tf.contrib.seq2seq.GreedyEmbeddingHelper в качестве помощника для моей модели вывода. Вывод, я получаю переводы, которые являются частично правильными, как, например, правильный перевод, объединенный с маркером конца последовательности&l…
26 дек '17 в 17:56
2 ответа

Как перевести текст с одного языка на другой язык android?

У меня есть ответ, который я анализирую от json и отображаю результат. Можно ли перевести на другой язык, например французский, хинди, немецкий? Когда я просмотрел, я узнал, что Google остановился на 2011 году в качестве бесплатной версии и начал це…
2 ответа

Лучший алгоритм синтаксического анализа для передачи лексической структуры?

В рамках более крупного проекта я хочу реализовать машинный переводчик с языка A на язык B. Поскольку нет доступных инструментов, которые автоматически выполняют машинный перевод на этом наборе языков, а доступный корпус языка B довольно мал, я пыта…
23 июн '16 в 14:06
0 ответов

Ошибка неверного запроса Microsoft Translator (400)

Я видел темы по этому вопросу, но моя проблема особенно запутанная. У меня есть бесплатная подписка на 2 миллиона символов, действительный идентификатор клиента и секрет. Когда я запускаю свой код, я несколько раз успешно вызываю API (максимум, что …
2 ответа

Как написать переведенные статьи MediaWiki через API, используя расширение Translate?

Я пишу сотни статей в MediaWiki (версия 1.20.2) через его API, используя самопрограммируемый скрипт PHP, который зависит от WikiMate. На данный момент статьи написаны только на английском языке. Но я хочу перевести их, используя расширение Translate…
1 ответ

Экономия тензорного кодера, декодера и внимания

Начните обучение с простого NMT (нейронного машинного переводчика) с вниманием, используя кодировщик и декодер, Обучение проходило на Colab, encoder = Encoder(vocab_inp_size, embedding_dim, units, BATCH_SIZE) decoder = Decoder(vocab_tar_size, embedd…
0 ответов

Последовательность начала декодера Tensorflow Seq2Seq не работает должным образом

Я реализую базовую модель seq2seq для нейронного машинного перевода. У меня есть вложение слов для кодера и декодера. Мой кодировщик использует функцию TrainingHelper, а мой декодер - GreedyEmbeddingHelper. Я пытался обучить свою сеть, используя две…
0 ответов

Ошибка скрипта moses train-model.perl, коэффициент --lm: порядок: имя файла обязательно

Когда я бегу: $MOSES/scripts/training/train-model.perl -hierarchical -ghkm -external-bin-dir /home/zhanwang/giza-pp/tools/ -root-dir . --corpus corpus/nl2mr --f mr --e nl показал: ОШИБКА: используйте --lm factor:order: имя файла, чтобы указать по кр…
26 мар '16 в 13:06
0 ответов

TensorFlow BeamSearchDecoder выводит sample_id как (фактический sample_id+1)

Написал ли я собственный код (вместо использования стандартного сценария, представленного в TensorFlow): Да. На основе учебника по NMT я пишу специальный код для своей задачи. Платформа и распространение ОС (например, Linux Ubuntu 16.04): Linux Ubun…
1 ответ

Является ли преобразование речи в текст невозможной мечтой?

Теоретически, можно использовать микрофон ноутбука, планшета или телефона для захвата произнесенных слов, преобразовать их в слова на экране, а затем, используя API-интерфейс, например, Google Translate, увидеть "a" (а не "the" - вряд ли когда-либо,…
5 ответов

Есть ли учебник о Гиза ++?

URL-адреса в файле readme недействительны ( http://www.fjoch.com/mkcls.html и http://www.fjoch.com/GIZA++.html). Есть хороший учебник о Гизе ++? Или есть какие-то альтернативы, которые имеют полную документацию?
22 апр '11 в 03:36
4 ответа

Как вы программируете переводчик со списками в прологе?

То, что я хочу сделать, это переводчик в Прологе. Я сделал что-то вроде этого, чтобы перевести одно слово: traducir(X,Y) :- traduccion( X, Y ). traduccion(gato,cat). И когда ты спрашиваешь Пролог traducir(X,cat), это отвечает X=gatoТо, что я хочу сд…
30 ноя '11 в 16:28
1 ответ

Сбой вызова метода перевода в Моисее как службе, использующей xml-rpc

Я сталкиваюсь с исключением, вызывающим moses (Статистический машинный перевод) как службу с установленным xmlrpc. Я сначала открываю порт для сервера Моисея --Listening on port 8082 но главная проблема - когда я отправляю запрос на отдых с параметр…
14 июн '18 в 14:51