Получить значение градиента, необходимое для разрыва изображения

Я экспериментировал с изображениями соперников и читал fast gradient sign method по следующей ссылке https://arxiv.org/pdf/1412.6572.pdf...

Инструкции объясняют, что необходимый градиент может быть рассчитан с помощью backpropagation...

Я преуспел в создании состязательных изображений, но мне не удалось извлечь градиент, необходимый для создания состязательного изображения. Я покажу, что я имею в виду.

Давайте предположим, что я уже обучил свой алгоритм, используя logistic regression, я restore модель и я извлекаем число, которое я хочу изменить в состязательное изображение. В данном случае это номер 2...

# construct model
logits = tf.matmul(x, W) + b
pred = tf.nn.softmax(logits)
...
...
# assign the images of number 2 to the variable
sess.run(tf.assign(x, labels_of_2))
# setup softmax
sess.run(pred)

# placeholder for target label
fake_label = tf.placeholder(tf.int32, shape=[1])
# setup the fake loss
fake_loss = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=logits,labels=fake_label)

# minimize fake loss using gradient descent,
# calculating the derivatives of the weight of the fake image will give the direction of weights necessary to change the prediction
adversarial_step = tf.train.GradientDescentOptimizer(learning_rate=FLAGS.learning_rate).minimize(fake_loss, var_list=[x])

# continue calculating the derivative until the prediction changes for all 10 images
for i in range(FLAGS.training_epochs):
    # fake label tells the training algorithm to use the weights calculated for number 6
    sess.run(adversarial_step, feed_dict={fake_label:np.array([6])})
    sess.run(pred)

Это мой подход, и он отлично работает. Он берет мое изображение с номером 2 и меняет его лишь слегка, поэтому, когда я запускаю следующее...

x_in = np.expand_dims(x[0], axis=0)
classification = sess.run(tf.argmax(pred, 1))
print(classification)

он будет предсказывать число 2 как число 6.

Проблема в том, что мне нужно извлечь градиент, необходимый, чтобы обмануть нейронную сеть, думая, что число 2 - 6. Мне нужно использовать этот градиент для создания nematode упомянутое выше.

Я не уверен, как я могу извлечь значение градиента. Я пытался смотреть на tf.gradients но я не смог понять, как создать состязательное изображение с помощью этой функции. Я реализовал следующее после fake_loss переменная выше...

tf.gradients(fake_loss, x)

for i in range(FLAGS.training_epochs):
    # calculate gradient with weight of number 6
    gradient_value = sess.run(gradients, feed_dict={fake_label:np.array([6])})
    # update the image of number 2
    gradient_update = x+0.007*gradient_value[0]
    sess.run(tf.assign(x, gradient_update))
    sess.run(pred)

К сожалению, предсказание не изменилось так, как я хотел, и, кроме того, эта логика привела к довольно размытому изображению.

Я был бы признателен за объяснение того, что мне нужно сделать, чтобы рассчитать и извлечь градиент, который обманет нейронную сеть, так что если бы я взял этот градиент и применил его к своему изображению как nematode, это приведет к другому прогнозу.

1 ответ

Решение

Почему бы не позволить оптимизатору Tensorflow добавить градиенты к вашему изображению? Вы все еще можете оценить нематоду, чтобы получить результирующие градиенты, которые были добавлены.

Я создал небольшой пример кода, чтобы продемонстрировать это с изображением панды. Он использует нейронную сеть VGG16 для преобразования вашего собственного изображения панды в изображение "золотой рыбки". Каждые 100 итераций изображение сохраняется в формате PDF, поэтому вы можете распечатать его без потерь, чтобы проверить, является ли ваше изображение золотой рыбкой.

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import IPython.display as ipyd
from libs import vgg16 # Download here! https://github.com/pkmital/CADL/tree/master/session-4/libs

pandaimage = plt.imread('panda.jpg')
pandaimage = vgg16.preprocess(pandaimage)
plt.imshow(pandaimage)

img_4d = np.array([pandaimage])

g = tf.get_default_graph()
input_placeholder = tf.Variable(img_4d,trainable=False)
to_add_image = tf.Variable(tf.random_normal([224,224,3], mean=0.0, stddev=0.1, dtype=tf.float32))
combined_images_not_clamped = input_placeholder+to_add_image

filledmax = tf.fill(tf.shape(combined_images_not_clamped), 1.0)
filledmin = tf.fill(tf.shape(combined_images_not_clamped), 0.0)
greater_than_one = tf.greater(combined_images_not_clamped, filledmax)

combined_images_with_max = tf.where(greater_than_one, filledmax, combined_images_not_clamped)
lower_than_zero =tf.less(combined_images_with_max, filledmin)
combined_images = tf.where(lower_than_zero, filledmin, combined_images_with_max)

net = vgg16.get_vgg_model()
tf.import_graph_def(net['graph_def'], name='vgg')
names = [op.name for op in g.get_operations()]

style_layer = 'prob:0'
the_prediction = tf.import_graph_def(
    net['graph_def'],
    name='vgg',
    input_map={'images:0': combined_images},return_elements=[style_layer])

goldfish_expected_np = np.zeros(1000)
goldfish_expected_np[1]=1.0
goldfish_expected_tf = tf.Variable(goldfish_expected_np,dtype=tf.float32,trainable=False)
loss = tf.reduce_sum(tf.square(the_prediction[0]-goldfish_expected_tf))
optimizer = tf.train.AdamOptimizer().minimize(loss)


sess = tf.InteractiveSession()
sess.run(tf.global_variables_initializer())


def show_many_images(*images):
    fig = plt.figure()
    for i in range(len(images)):
        print(images[i].shape)
        subplot_number = 100+10*len(images)+(i+1)
        plt.subplot(subplot_number)
        plt.imshow(images[i])
    plt.show()



for i in range(1000):
    _, loss_val = sess.run([optimizer,loss])

    if i%100==1:
        print("Loss at iteration %d: %f" % (i,loss_val))
        _, loss_val,adversarial_image,pred,nematode = sess.run([optimizer,loss,combined_images,the_prediction,to_add_image])
        res = np.squeeze(pred)
        average = np.mean(res, 0)
        res = res / np.sum(average)
        plt.imshow(adversarial_image[0])
        plt.show()
        print([(res[idx], net['labels'][idx]) for idx in res.argsort()[-5:][::-1]])
        show_many_images(img_4d[0],nematode,adversarial_image[0])
        plt.imsave('adversarial_goldfish.pdf',adversarial_image[0],format='pdf') # save for printing

Дайте мне знать, если это поможет вам!

Другие вопросы по тегам