Описание тега neural-mt

0 ответов

Как список предложений для NMT должен быть сведен в одно "предложение" для облегчения встраивания скипграмм?

контекст Перед внедрением нейронного машинного перевода необходимо изучить встраивания для исходного и целевого языков. Для этого мы используем skip-gram Модель Word2Vec. Учебное пособие Tensorflow, связанное выше, начинается со списка слов. Для соз…
1 ответ

Функция динамического словаря в NMT V3

Я слышал, что должна быть возможность добавить динамический словарь, содержащий набор терминов или список слов, когда вы тренируете свою модель. Это должно быть возможно в переводческой панели сегодня. Как сделать это с помощью V3 или NMT в portal.c…
20 июн '18 в 12:17
1 ответ

Как найти и запустить самую большую партию в наборе данных перед началом обучения

Вопрос В Tensorflow я часто сталкиваюсь с ошибками OOM во время первой эпохи обучения. Тем не менее, большая природа сети приводит к тому, что первая эпоха занимает около часа, слишком много, чтобы быстро протестировать новые гиперпараметры. В идеал…
1 ответ

Ориентировочная дата выпуска функции словаря в V3 NMT

Мой отдел планирует в ближайшее время перейти на использование NMT V3, но для обучения нам понадобится функция словаря (добавление глоссария и списка "Не переводить"). Возможно, об этом уже спрашивали, но я не вижу ни одного недавнего поста с просьб…
0 ответов

Объект LSTMStateTuple не имеет атрибута get_shape при добавлении двунаправленного кодировщика

Краткое описание проблемы У меня проблема с добавлением двунаправленного энкодера в мою модель NMT. Это добавляет вторую ячейку LSTM, которая проходит назад через исходные данные, чтобы улучшить качество перевода. Моя реализация ниже основана на это…
1 ответ

Можете ли вы использовать словарь с категорией generalnn в MS Text API?

Есть ли способ загрузить словарь терминологии в Hub, который будет применяться при переводе с использованием категории generalnn (не обученный движок)? Обходное решение, которое, кажется, работает, - это использовать тег , например: Let's do a <m…
04 май '18 в 19:54
1 ответ

Сборка Docker из Dockerfile с большим объемом памяти

Как docker build из Dockerfile с большей памятью? Это другой вопрос из этого Разрешить больше памяти, когда Docker собирает Dockerfile При первоначальной установке программного обеспечения достаточно памяти для успешной сборки и установки marian инс…
28 июл '17 в 02:10
0 ответов

Нейронная сеть Matlab удалить специфический нейрон

Я использую функции нейронной сети Matlab с прямой связью. Алгоритм по умолчанию создает полностью подключенную сеть, возможно ли создать сеть, которая не полностью подключена, и возможно ли удалить какое-то конкретное нейронное соединение? Просто ч…
2 ответа

Tensorflow ResourceExhaustedError после первого пакета

Резюме и тестовые случаи Основная проблема заключается в том, что Tensorflow создает распределения OOM для пакета, который не является первым, как я ожидал. Поэтому я считаю, что существует утечка памяти, поскольку вся память явно не освобождается п…
10 дек '17 в 22:01
0 ответов

Beam Search Decoder выводит -1 в качестве прогноза (как это возможно?)

Когда я реализую Beam Search Decoder, его первое предсказание выдает -1 с несколькими временными шагами. Я не понимаю, как это возможно, так как проекционному слою передается размер словаря, который индексируется от 0. Например, с помощью жадного де…
0 ответов

API переводчика Microsoft - опция notranslate не работает с Neural Network MT

Кто-нибудь испытывает, что опция notranslate игнорируется при отправке в Microsoft Neural Network MT? Эта же строка работает с SMT. Я отправляю это с "text / html". Мой пример строки: <p>For example, it is important to install the latest <s…
0 ответов

Нейронный машинный перевод: объединение горячего вложения с плотным встраиванием?

В настоящее время я читаю газету о Google's transformer architecture для нейронного машинного перевода ('Attention is all you need'). В основанной на RNN настройке seq2seq исходное предложение и выходное предложение обычно кодируются в горячем виде.…
1 ответ

Как использовать BLEU для сравнения вашей модели с существующими моделями?

Поэтому я использую метрику оценки BLEU для сравнения производительности моей модели NMT с существующими моделями. Однако мне интересно, сколько настроек мне нужно, чтобы соответствовать другим моделям. Такие настройки, как наборы разработчика, набо…
21 апр '19 в 12:25
1 ответ

Можно ли сравнивать баллы Test BLEU между моделями NMT, используя слегка модифицированные стандартные тестовые наборы?

Я использую tst2013.en, найденный здесь, как мои тестовые наборы, чтобы получить Тест BLEU оценка для сравнения с другими предыдущими моделями. Однако я должен отфильтровать некоторые предложения, которые длиннее 100 слов, иначе у меня не будет ресу…
22 апр '19 в 08:20
0 ответов

Как пары повторяющихся предложений влияют на параллельный корпус и модель перевода?

Я работаю над парой языков с низким ресурсом, и доступный параллельный корпус очень шумный. При очистке данных я обнаружил, что в корпусе много пар повторяющихся предложений. Предложения выровнены в отдельных файлах правильно, но есть повторы. Я нач…
1 ответ

Реализуйте внимание в архитектуре ванильного кодера-декодера

Я пробовал арку vanila enc-dec следующим образом (с английского на французский NMT) Я хочу знать, как интегрировать здесь слой внимания keras. Также приветствуется либо из документации keras, либо из любого другого модуля внимания из стороннего репо…
0 ответов

Машинное обучение для анализа и генерации предложений из заданных текстовых входов

Я пытаюсь создать программу, которая переводит язык жестов в текст и применяет NLP, чтобы текст был понятен человеку. Я использовал CNN для распознавания языка жестов, но я не знаю, как преобразовать распознанный текст в естественный язык. По идее д…
11 июн '21 в 12:12