Описание тега tensor2tensor

1 ответ

Перезапись методов с помощью миксин-паттерна не работает как задумано

Я пытаюсь представить мод /mixin для проблемы. В частности, я сосредоточен здесь на SpeechRecognitionProblem, Я намерен изменить эту проблему, и поэтому я стараюсь сделать следующее: class SpeechRecognitionProblemMod(speech_recognition.SpeechRecogni…
02 ноя '18 в 09:34
0 ответов

Запуск модели трансформатора с Tensor2Tensor с использованием Mesh-Tensorflow(реализация на GPU)

Я пытаюсь запустить модель трансформатора с Tensor2tensor, используя mesh-tenorflow (GPU-реализация), но сталкиваюсь с несколькими ошибками. Я пытался запустить приведенный ниже код, но столкнулся с несколькими проблемами. Я также приложил журнал ош…
06 фев '19 в 08:42
0 ответов

Буфер для стабилизации GAN в парадигме Tensor2Tensor / Estimator

Я хотел бы стабилизировать обучение GAN, поддерживая историю сгенерированных примеров, которые будут по-прежнему подаваться на дискриминатор вместе с текущим G(x) для предотвращения чрезмерного соответствия D текущей версии G. Я также хотел бы сдела…
08 ноя '18 в 21:26
1 ответ

Как использовать тензор2тенора для классификации текста?

Я хочу провести двоичную классификацию текста с использованием тензорного тензора только с вниманием и без слоев предварительной обработки LSTM или CNN. Я думаю, что модель transformer_encoder является лучшей для меня ,, но я не могу найти ни одной …
0 ответов

Когда для предоставления обслуживания модели используется тензор flow_model_server, как я могу доставить в него decode_hparams?

Я обучил трансформаторную модель тензорного тензора переводить английский на китайский. Когда я использую t2t-decoder Команда для оценки перевода, я могу поставить "--decode_hparams=beam_size=4,alpha=0.6" для t2t-decoder, чтобы контролировать его по…
2 ответа

Тюнинг на основе TPU для CloudML

Поддерживаются ли TPU для распределенного поиска гиперпараметров? Я использую tensor2tensor библиотека, которая поддерживает CloudML для поиска гиперпараметров, т. е. мне нужно выполнить поиск гиперпараметров для языковой модели на графических проце…
0 ответов

Tensor2Tensor не удалось найти базовый путь для работоспособной модели

У меня проблемы с обслуживанием моего сохраненного_моделя.pbtxt, я экспортировал модель, используя t2t-exporter для обслуживания в докере. Я перешел по этой ссылке на tenorflow с докером, но он не работает для меня, скриншот ошибки
18 фев '19 в 09:01
0 ответов

Как подготовить вектор смещения в tenor2tensor?

У меня проблемы с пониманием того, как bias работает в tensor2tensorособенно в multihead_attention или же dot_product_attention, Я хочу использовать его в качестве библиотеки для моей проблемы. Допустим, у меня есть входной тензор, T с размером, (ba…
19 фев '19 в 13:52
1 ответ

AttributeError: у объекта "HParams" нет атрибута "get"

Когда мы используем декодирование тензорного тензора, мы столкнулись с этой проблемой. t2t-decoder \ --data_dir=train_data_enzh \ --problem=translate_enzh_wmt32k \ --model=transformer \ --hparams_set=transformer_base \ --output_dir=enzhdata/model \ …
26 май '18 в 06:33
0 ответов

Как создать контрольную точку TensorFlow без сеанса?

Я хочу ускорить инструмент для усреднения нескольких контрольных точек TensorFlow, но для простоты, скажем, мне нужно просто загрузить одну контрольную точку, возможно изменить некоторые переменные и сохранить ее на диск. Текущая реализация загружае…
11 дек '17 в 19:35
0 ответов

Высокая дисперсия в тензорных потерях

Я создаю языковую модель через Twitter с набором параметров transformer_big. Единственное изменение, которое я сделал, это max_length=64 (потому что твиты обычно короткие). Я использую 8 графических процессоров Tesla V100, и моя потеря выглядит так …
25 июн '18 в 12:24
0 ответов

Несоответствие размера партии модели tenor2tensor и модели трансформатора

Я попытался реализовать настроенный файл модели LSTM tenor2tensor на основе модели. Однако я обнаружил, что размер пакета модели lstm не соответствует hparams.batch_size, я использую задачу машинного перевода (translate_ende_wmt32k). в функции тела,…
05 мар '18 в 21:42
1 ответ

Длинные предложения не подходят для моделей глубокого обучения?

Интересно узнать, хороши ли длинные предложения для обучения модели тензорного тензора. А почему или почему нет?
1 ответ

Импорт нескольких пользовательских задач tenor2tensor во Flask

В API-интерфейсе flask_restplus я пытаюсь сделать вывод из двух моделей tennors2tensor, которые обслуживаются на одном сервере. Обе эти модели являются пользовательскими, поэтому я поставляю t2t_usr_dir для обслуживающих функций tenor2tensor, чтобы …
0 ответов

Нахождение реализации RNN/LSTM в g2p-seq2seq

Я скачал пакет CMU g2p-seq2seq и установил его на своей машине с Ubuntu. Я пытался найти тип сети (RNN/LSTM), используемый при обучении модели. Я посмотрел на сеть LSTM в tenor2tensor/models/lstm.py и в тензорном потоке /python/ops/rnn_cell.py, тенз…
18 сен '18 в 15:02
0 ответов

bfloat16 не работает в tenor2tensor

Я пытаюсь использовать половинную точность (bfloat16) с tensor2tensorно похоже что есть несоответствие типов Тензор-GPU: 1.8.0 Тензор2Тензор: 1.6.3 Python: 2.7.12 ОС: Ubuntu 16.04.4 LTS Я запускаю эту команду для генерации данных: t2t-datagen --t2t_…
16 авг '18 в 16:30
2 ответа

Есть ли альтернатива tpu_trainer_lib?

Я пытался запустить Google Tensor2tensor ( https://github.com/tensorflow/tensor2tensor) локально, но он задыхается, когда доходит до этого бита: from tensor2tensor.tpu import tpu_trainer_lib Что имеет смысл, потому что в моем Mac нет TPU. Есть ли ал…
05 фев '18 в 21:46
0 ответов

Как я могу использовать Tension2tensor'stillation.py, чтобы перевести знания из сети учителя в сеть ученика?

Проблема верхнего уровня Я хочу использовать сеть учителей и распределить ее производительность / знания на небольшом подмножестве его возможностей в другую более простую модель Попытка решения Я пытаюсь начать работу с кодом дистилляции T2T. https:…
14 ноя '18 в 01:34
0 ответов

Tensor2Tensor оценивает деталь, не загружающую модель

Я боролся с этой проблемой уже неделю или больше и попробовал несколько общих / поверхностных вещей, таких как: разные версии python, tensflow, tennors2tensor, различные местоположения каталогов и т. д., чтобы заставить его работать. нашел несколько…
2 ответа

OutOfRangeError в увеличении учебника Tensor2Tensor Transformer TPU

Я последовал примеру T2T Transformer "Обучение языковой модели", и он работал на 10 этапах обучения. Однако при масштабировании до 250000 шагов я получаю ошибку OutOfRange (ниже). Это проблема с разбором или что-то еще? INFO:tensorflow:Init TPU syst…
06 июл '18 в 21:17