Описание тега neural-mt
0
ответов
Как список предложений для NMT должен быть сведен в одно "предложение" для облегчения встраивания скипграмм?
контекст Перед внедрением нейронного машинного перевода необходимо изучить встраивания для исходного и целевого языков. Для этого мы используем skip-gram Модель Word2Vec. Учебное пособие Tensorflow, связанное выше, начинается со списка слов. Для соз…
21 ноя '17 в 18:57
1
ответ
Функция динамического словаря в NMT V3
Я слышал, что должна быть возможность добавить динамический словарь, содержащий набор терминов или список слов, когда вы тренируете свою модель. Это должно быть возможно в переводческой панели сегодня. Как сделать это с помощью V3 или NMT в portal.c…
20 июн '18 в 12:17
1
ответ
Как найти и запустить самую большую партию в наборе данных перед началом обучения
Вопрос В Tensorflow я часто сталкиваюсь с ошибками OOM во время первой эпохи обучения. Тем не менее, большая природа сети приводит к тому, что первая эпоха занимает около часа, слишком много, чтобы быстро протестировать новые гиперпараметры. В идеал…
02 фев '18 в 01:09
1
ответ
Ориентировочная дата выпуска функции словаря в V3 NMT
Мой отдел планирует в ближайшее время перейти на использование NMT V3, но для обучения нам понадобится функция словаря (добавление глоссария и списка "Не переводить"). Возможно, об этом уже спрашивали, но я не вижу ни одного недавнего поста с просьб…
19 окт '18 в 11:43
0
ответов
Объект LSTMStateTuple не имеет атрибута get_shape при добавлении двунаправленного кодировщика
Краткое описание проблемы У меня проблема с добавлением двунаправленного энкодера в мою модель NMT. Это добавляет вторую ячейку LSTM, которая проходит назад через исходные данные, чтобы улучшить качество перевода. Моя реализация ниже основана на это…
31 янв '18 в 02:09
1
ответ
Можете ли вы использовать словарь с категорией generalnn в MS Text API?
Есть ли способ загрузить словарь терминологии в Hub, который будет применяться при переводе с использованием категории generalnn (не обученный движок)? Обходное решение, которое, кажется, работает, - это использовать тег , например: Let's do a <m…
04 май '18 в 19:54
1
ответ
Сборка Docker из Dockerfile с большим объемом памяти
Как docker build из Dockerfile с большей памятью? Это другой вопрос из этого Разрешить больше памяти, когда Docker собирает Dockerfile При первоначальной установке программного обеспечения достаточно памяти для успешной сборки и установки marian инс…
28 июл '17 в 02:10
0
ответов
Нейронная сеть Matlab удалить специфический нейрон
Я использую функции нейронной сети Matlab с прямой связью. Алгоритм по умолчанию создает полностью подключенную сеть, возможно ли создать сеть, которая не полностью подключена, и возможно ли удалить какое-то конкретное нейронное соединение? Просто ч…
07 фев '18 в 17:45
2
ответа
Tensorflow ResourceExhaustedError после первого пакета
Резюме и тестовые случаи Основная проблема заключается в том, что Tensorflow создает распределения OOM для пакета, который не является первым, как я ожидал. Поэтому я считаю, что существует утечка памяти, поскольку вся память явно не освобождается п…
10 дек '17 в 22:01
0
ответов
Beam Search Decoder выводит -1 в качестве прогноза (как это возможно?)
Когда я реализую Beam Search Decoder, его первое предсказание выдает -1 с несколькими временными шагами. Я не понимаю, как это возможно, так как проекционному слою передается размер словаря, который индексируется от 0. Например, с помощью жадного де…
28 янв '18 в 03:35
0
ответов
API переводчика Microsoft - опция notranslate не работает с Neural Network MT
Кто-нибудь испытывает, что опция notranslate игнорируется при отправке в Microsoft Neural Network MT? Эта же строка работает с SMT. Я отправляю это с "text / html". Мой пример строки: <p>For example, it is important to install the latest <s…
13 апр '18 в 18:45
0
ответов
Нейронный машинный перевод: объединение горячего вложения с плотным встраиванием?
В настоящее время я читаю газету о Google's transformer architecture для нейронного машинного перевода ('Attention is all you need'). В основанной на RNN настройке seq2seq исходное предложение и выходное предложение обычно кодируются в горячем виде.…
21 апр '19 в 08:29
1
ответ
Как использовать BLEU для сравнения вашей модели с существующими моделями?
Поэтому я использую метрику оценки BLEU для сравнения производительности моей модели NMT с существующими моделями. Однако мне интересно, сколько настроек мне нужно, чтобы соответствовать другим моделям. Такие настройки, как наборы разработчика, набо…
21 апр '19 в 12:25
1
ответ
Можно ли сравнивать баллы Test BLEU между моделями NMT, используя слегка модифицированные стандартные тестовые наборы?
Я использую tst2013.en, найденный здесь, как мои тестовые наборы, чтобы получить Тест BLEU оценка для сравнения с другими предыдущими моделями. Однако я должен отфильтровать некоторые предложения, которые длиннее 100 слов, иначе у меня не будет ресу…
22 апр '19 в 08:20
0
ответов
Как пары повторяющихся предложений влияют на параллельный корпус и модель перевода?
Я работаю над парой языков с низким ресурсом, и доступный параллельный корпус очень шумный. При очистке данных я обнаружил, что в корпусе много пар повторяющихся предложений. Предложения выровнены в отдельных файлах правильно, но есть повторы. Я нач…
21 июн '19 в 14:02
1
ответ
Реализуйте внимание в архитектуре ванильного кодера-декодера
Я пробовал арку vanila enc-dec следующим образом (с английского на французский NMT) Я хочу знать, как интегрировать здесь слой внимания keras. Также приветствуется либо из документации keras, либо из любого другого модуля внимания из стороннего репо…
30 авг '20 в 09:18
0
ответов
Машинное обучение для анализа и генерации предложений из заданных текстовых входов
Я пытаюсь создать программу, которая переводит язык жестов в текст и применяет NLP, чтобы текст был понятен человеку. Я использовал CNN для распознавания языка жестов, но я не знаю, как преобразовать распознанный текст в естественный язык. По идее д…
11 июн '21 в 12:12