Описание тега tensor2tensor
1
ответ
Перезапись методов с помощью миксин-паттерна не работает как задумано
Я пытаюсь представить мод /mixin для проблемы. В частности, я сосредоточен здесь на SpeechRecognitionProblem, Я намерен изменить эту проблему, и поэтому я стараюсь сделать следующее: class SpeechRecognitionProblemMod(speech_recognition.SpeechRecogni…
02 ноя '18 в 09:34
0
ответов
Запуск модели трансформатора с Tensor2Tensor с использованием Mesh-Tensorflow(реализация на GPU)
Я пытаюсь запустить модель трансформатора с Tensor2tensor, используя mesh-tenorflow (GPU-реализация), но сталкиваюсь с несколькими ошибками. Я пытался запустить приведенный ниже код, но столкнулся с несколькими проблемами. Я также приложил журнал ош…
06 фев '19 в 08:42
0
ответов
Буфер для стабилизации GAN в парадигме Tensor2Tensor / Estimator
Я хотел бы стабилизировать обучение GAN, поддерживая историю сгенерированных примеров, которые будут по-прежнему подаваться на дискриминатор вместе с текущим G(x) для предотвращения чрезмерного соответствия D текущей версии G. Я также хотел бы сдела…
08 ноя '18 в 21:26
1
ответ
Как использовать тензор2тенора для классификации текста?
Я хочу провести двоичную классификацию текста с использованием тензорного тензора только с вниманием и без слоев предварительной обработки LSTM или CNN. Я думаю, что модель transformer_encoder является лучшей для меня ,, но я не могу найти ни одной …
19 окт '17 в 10:51
0
ответов
Когда для предоставления обслуживания модели используется тензор flow_model_server, как я могу доставить в него decode_hparams?
Я обучил трансформаторную модель тензорного тензора переводить английский на китайский. Когда я использую t2t-decoder Команда для оценки перевода, я могу поставить "--decode_hparams=beam_size=4,alpha=0.6" для t2t-decoder, чтобы контролировать его по…
17 май '18 в 05:59
2
ответа
Тюнинг на основе TPU для CloudML
Поддерживаются ли TPU для распределенного поиска гиперпараметров? Я использую tensor2tensor библиотека, которая поддерживает CloudML для поиска гиперпараметров, т. е. мне нужно выполнить поиск гиперпараметров для языковой модели на графических проце…
24 июл '18 в 13:37
0
ответов
Tensor2Tensor не удалось найти базовый путь для работоспособной модели
У меня проблемы с обслуживанием моего сохраненного_моделя.pbtxt, я экспортировал модель, используя t2t-exporter для обслуживания в докере. Я перешел по этой ссылке на tenorflow с докером, но он не работает для меня, скриншот ошибки
18 фев '19 в 09:01
0
ответов
Как подготовить вектор смещения в tenor2tensor?
У меня проблемы с пониманием того, как bias работает в tensor2tensorособенно в multihead_attention или же dot_product_attention, Я хочу использовать его в качестве библиотеки для моей проблемы. Допустим, у меня есть входной тензор, T с размером, (ba…
19 фев '19 в 13:52
1
ответ
AttributeError: у объекта "HParams" нет атрибута "get"
Когда мы используем декодирование тензорного тензора, мы столкнулись с этой проблемой. t2t-decoder \ --data_dir=train_data_enzh \ --problem=translate_enzh_wmt32k \ --model=transformer \ --hparams_set=transformer_base \ --output_dir=enzhdata/model \ …
26 май '18 в 06:33
0
ответов
Как создать контрольную точку TensorFlow без сеанса?
Я хочу ускорить инструмент для усреднения нескольких контрольных точек TensorFlow, но для простоты, скажем, мне нужно просто загрузить одну контрольную точку, возможно изменить некоторые переменные и сохранить ее на диск. Текущая реализация загружае…
11 дек '17 в 19:35
0
ответов
Высокая дисперсия в тензорных потерях
Я создаю языковую модель через Twitter с набором параметров transformer_big. Единственное изменение, которое я сделал, это max_length=64 (потому что твиты обычно короткие). Я использую 8 графических процессоров Tesla V100, и моя потеря выглядит так …
25 июн '18 в 12:24
0
ответов
Несоответствие размера партии модели tenor2tensor и модели трансформатора
Я попытался реализовать настроенный файл модели LSTM tenor2tensor на основе модели. Однако я обнаружил, что размер пакета модели lstm не соответствует hparams.batch_size, я использую задачу машинного перевода (translate_ende_wmt32k). в функции тела,…
05 мар '18 в 21:42
1
ответ
Длинные предложения не подходят для моделей глубокого обучения?
Интересно узнать, хороши ли длинные предложения для обучения модели тензорного тензора. А почему или почему нет?
18 янв '19 в 10:11
1
ответ
Импорт нескольких пользовательских задач tenor2tensor во Flask
В API-интерфейсе flask_restplus я пытаюсь сделать вывод из двух моделей tennors2tensor, которые обслуживаются на одном сервере. Обе эти модели являются пользовательскими, поэтому я поставляю t2t_usr_dir для обслуживающих функций tenor2tensor, чтобы …
13 сен '18 в 13:45
0
ответов
Нахождение реализации RNN/LSTM в g2p-seq2seq
Я скачал пакет CMU g2p-seq2seq и установил его на своей машине с Ubuntu. Я пытался найти тип сети (RNN/LSTM), используемый при обучении модели. Я посмотрел на сеть LSTM в tenor2tensor/models/lstm.py и в тензорном потоке /python/ops/rnn_cell.py, тенз…
18 сен '18 в 15:02
0
ответов
bfloat16 не работает в tenor2tensor
Я пытаюсь использовать половинную точность (bfloat16) с tensor2tensorно похоже что есть несоответствие типов Тензор-GPU: 1.8.0 Тензор2Тензор: 1.6.3 Python: 2.7.12 ОС: Ubuntu 16.04.4 LTS Я запускаю эту команду для генерации данных: t2t-datagen --t2t_…
16 авг '18 в 16:30
2
ответа
Есть ли альтернатива tpu_trainer_lib?
Я пытался запустить Google Tensor2tensor ( https://github.com/tensorflow/tensor2tensor) локально, но он задыхается, когда доходит до этого бита: from tensor2tensor.tpu import tpu_trainer_lib Что имеет смысл, потому что в моем Mac нет TPU. Есть ли ал…
05 фев '18 в 21:46
0
ответов
Как я могу использовать Tension2tensor'stillation.py, чтобы перевести знания из сети учителя в сеть ученика?
Проблема верхнего уровня Я хочу использовать сеть учителей и распределить ее производительность / знания на небольшом подмножестве его возможностей в другую более простую модель Попытка решения Я пытаюсь начать работу с кодом дистилляции T2T. https:…
14 ноя '18 в 01:34
0
ответов
Tensor2Tensor оценивает деталь, не загружающую модель
Я боролся с этой проблемой уже неделю или больше и попробовал несколько общих / поверхностных вещей, таких как: разные версии python, tensflow, tennors2tensor, различные местоположения каталогов и т. д., чтобы заставить его работать. нашел несколько…
19 июл '18 в 01:39
2
ответа
OutOfRangeError в увеличении учебника Tensor2Tensor Transformer TPU
Я последовал примеру T2T Transformer "Обучение языковой модели", и он работал на 10 этапах обучения. Однако при масштабировании до 250000 шагов я получаю ошибку OutOfRange (ниже). Это проблема с разбором или что-то еще? INFO:tensorflow:Init TPU syst…
06 июл '18 в 21:17