Описание тега tensorflow-gradient

Тег для вопросов, касающихся вычисления градиента, авто-дифференцирования и оценки в тензорном потоке
1 ответ

Используя тензор потока, как вы можете усреднить значения градиента параметров по количеству пакетов и обновить их с помощью этого среднего значения?

Как и многие люди, разрабатывающие модели глубокого обучения, мне мешают мои аппаратные ресурсы, а именно память GPU. У меня проблема с классификацией звука, для которой я пробую несколько RNN. Данные очень большие, и я могу использовать только небо…
26 сен '18 в 15:02
1 ответ

Как назначить пользовательский градиент для операции TensorFlow с несколькими входами

Я пытаюсь использовать TensorFlow's @tf.custom_gradient функциональность для назначения собственного градиента функции с несколькими входами. Я могу собрать рабочую настройку только для одного входа, но не для двух или более. Я основал свой код на д…
04 янв '19 в 23:45
1 ответ

Tensorflow TypeError: аргумент Fetch. При поиске градиента None имеет недопустимый тип <class 'NoneType'>.

Это задача анализа текста с моделью CNN, я хочу визуализировать, какое слово вызывает больше всего для моей конкретной классификации. Вот мой код with tf.Session() as sess: saver = tf.train.import_meta_graph('/home/rakesh/WORK/CNN_Lookout/runs/15190…
1 ответ

Как сделать обратный переход через модель, которая предсказывает веса для другого в Tensorflow

В настоящее время я пытаюсь обучить модель (гиперсеть), которая может предсказать весовые коэффициенты для другой модели (основной сети) так, чтобы потеря кросс-энтропии основной сети уменьшалась. Однако когда я использую tf.assign для назначения но…
1 ответ

Могу ли я получить градиент тензора относительно входа без применения ввода?

Например, мне нужно вычислить градиент cross_entropy в отношении x, но мне нужно применить другое значение к функции градиента. То есть: f'(x)|x = x_t Я думаю tf.gradients() Функция даст только градиент при x = x, Так обеспечивает ли тензор поток ка…
0 ответов

Могу ли я вернуть переменные в дополнение к градиенту, используя tf.registergradient

У меня есть вопрос по поводу операции tf.registergradient Я использую @tf.registergradient для внесения пользовательских изменений в градиенты тензорного потока. Примечание. Я не изменяю только дельта-часть градиентов с задним ходом. Это работает но…
08 мар '18 в 11:00
0 ответов

Обратное распространение tf.stop_gradient и tf.gradients

Можем ли мы использовать tf.stop_gradient или tf.gradients, чтобы остановить обратное распространение? Собственно обновление всех весов?
0 ответов

Используйте методы поворота и перевода из TensorFlow с Backprop

Сегодня я столкнулся с проблемой при использовании tf.contrib.image.rotate и tf.contrib.image.translate в TensorFlow. Я хочу обучить сверточную сеть оценивать вращение и сдвиг между двумя 2D-изображениями лазера в качестве входных данных. network = …
2 ответа

Тензор потока: изменение весов параметров отличается от того, которое должно быть основано на градиентах

РЕДАКТИРОВАТЬ: Решено - это было глупо использовать различные обучающие примеры для градиентов против обновления оптимизатора. Хорошо, это меня полностью озадачило. У меня есть вектор параметров, давайте назовем его w. w = [-1,34554319, 0,86998659, …
21 мар '18 в 08:21
1 ответ

stop_gradient в тензорном потоке

Мне интересно, останавливает ли tf.stop_gradient вычисление градиента только для данной операции или останавливает обновление входных данных tf.variable? У меня есть следующая проблема: во время вычисления прямого пути в MNIST я хотел бы выполнить н…
07 май '18 в 20:15
0 ответов

Применение градиента одного слоя к предыдущему слою во время backprop

Я пытаюсь обойти градиент от слоя слияния (сделав его равным нулю) и применить градиент следующей области "оценка объема" на слое слияния на backprop. Я не мог найти похожий сценарий, чтобы применить его. Как я могу это сделать? graph = tf.Graph () …
1 ответ

OpenAI Градиентная контрольная точка с Tensorflow Eager Execution

Я недавно перешел на Tensorflow Eager (в настоящее время работаю с TF 1.8.0) и мне это очень нравится. Однако теперь у меня есть довольно большая модель, которая не вписывается в мою память GPU (GTX 1080Ti, 12 ГБ VRAM) при работе с лентой градиента,…
1 ответ

Тензор потока: расчет градиента от входа к выходу

Я хотел бы рассчитать градиенты вывода нейронной сети по отношению к входу. У меня есть следующие тензоры: Input: (num_timesteps, features) Output: (num_timesteps, 1) Для градиентов от входных данных ко всему выходному вектору я могу использовать сл…
2 ответа

Разница между шагами и num_epochs

Я не понимаю необходимость использования steps а также num_epochs в любом виде кода ML. Некоторые программы включают обе переменные одновременно. Может кто-нибудь мне помочь?
1 ответ

Как распечатать градиенты во время тренировок в Tensorflow?

Для отладки модели Tensorflow мне нужно посмотреть, изменились ли градиенты или есть ли в них nans. Простая печать переменной в Tensorflow не работает, потому что все, что вы видите, это: &lt;tf.Variable 'Model/embedding:0' shape=(8182, 100) dtype=f…
0 ответов

Создание GAN с эффективным использованием памяти в keras: `clear_session`, приводящий к конфликту тензорных графов

Я написал код для общей состязательной сети, которая будет работать в течение 4000 эпох, однако после 2000 эпох - время компиляции модели и использование памяти становятся очень неэффективными, и код выполняется крайне медленно. Я хотел бы сделать м…
06 фев '19 в 23:24
1 ответ

Как следить за градиентом исчезновения и взрывом в керасе с тензорной доской?

Я хотел бы отслеживать изменения градиента в тензорной доске с помощью кераса, чтобы решить, исчезнет ли градиент или взорвется. Что я должен делать?
0 ответов

Потеря NaN происходит с пользовательской функцией потерь, даже если градиент установлен на 0

Я пытался реализовать пользовательскую функцию потерь для TF Estimator, но TensorFlow возвращает потери NaN. Это происходит даже при установке низкой скорости обучения (1e-10) или 0. Если принудительно установить градиент на 0, нейронная сеть работа…
16 сен '18 в 18:53
1 ответ

Tensorflow - градиенты для любой переменной не предусмотрены

Я экспериментирую с кодом на Jupyter и продолжаю застрять здесь. На самом деле все работает нормально, если я удаляю строку, начинающуюся с "optimizer =...", и все ссылки на эту строку. Но если я вставлю эту строку в код, это выдаст ошибку. Я не вст…
1 ответ

Обновление тензора в тензорном потоке

Я определил неконтролируемую проблему в тензорном потоке, мне нужно обновлять мой B и мой tfZ с каждой итерацией, но я не знаю, как обновить мой tfZ используя сеанс tenorflow. tfY = tf.placeholder(shape=(15, 15), dtype=tf.float32) with tf.variable_s…