Запуск модели трансформатора с Tensor2Tensor с использованием Mesh-Tensorflow(реализация на GPU)

Я пытаюсь запустить модель трансформатора с Tensor2tensor, используя mesh-tenorflow (GPU-реализация), но сталкиваюсь с несколькими ошибками.

Я пытался запустить приведенный ниже код, но столкнулся с несколькими проблемами. Я также приложил журнал ошибок.

Код:

PROBLEM=translate_enfr_wmt32k 
MODEL=mtf_transformer 
HPARAMS=mtf_transformer_paper_tr_0_mesh_8
DATA_DIR=$HOME/t2t_data
TMP_DIR=/tmp/t2t_datagen
TRAIN_DIR=$HOME/t2t_train/$PROBLEM/$MODEL-$HPARAMS
mkdir -p $DATA_DIR $TMP_DIR $TRAIN_DIR

datagen:

t2t-datagen \
 --data_dir=$DATA_DIR \ 
 --tmp_dir=$TMP_DIR \
 --problem=$PROBLEM

поезд:

t2t-trainer \
 --data_dir=$DATA_DIR \  
 --problem=$PROBLEM \ 
 --model=$MODEL \
 --hparams_set=$HPARAMS \ 
 --output_dir=$TRAIN_DIR  \
 --train_steps=10

Ошибка:

tf_session.ExtendSession (self._session) tenorflow.python.framework.errors_impl.InvalidArgumentError: Несколько регистраций OpKernel соответствуют NodeDef '{{преобразователь / выпадение узла /binary_op/parallel_0_1/Less}}': 'op: "Less" device_type: "CPU" constraint { name: "T" allow_values ​​{ list { type: DT_BFLOAT16 } } }'и' op:" Less "device_type:" CPU "ограничение {name:" T "allow_values ​​{список {тип: DT_BFLOAT16 } } }' [[трансформатор / отсев / binary_op / parallel_0_1 / Меньше]]

0 ответов

Другие вопросы по тегам