Генерация противоборствующих данных из моделей атак умных людей

Question

Генерация противоборствующих данных из моделей атак умных людей

Мне нужен пример кода для того, как генерировать данные о поездах из атак со стороны умного Ганса.

adv_x = fgsm.generate_np(X_test, **fgsm_params)

Это генерирует состязательные данные x, но как я могу получить y?

adv_pred = model.predict_classes(adv_x)

И это даст "одураченные" результаты, верно?

Я хочу правильно показать сгенерированные x, y, одураченные y (под которыми я подразумеваю результаты предсказаний моделей, которые могут быть ложными из-за атаки). Я использую Mnist, кстати, если это поможет.

1

python tensorflow machine-learning deep-learning cleverhans

Источник

user8568673 18 дек '18 в 05:52

1 ответ

Решение

Другие вопросы по тегам python tensorflow machine-learning deep-learning cleverhans

user10560104 18 дек '18 в 16:23 2018-12-18 16:23 · Accepted Answer · 2018-12-18 16:23

Основываясь на фрагментах кода, которыми вы поделились, я бы сделал два предложения:

Как правило, не рекомендуется тренировать модель на тестовых данных (если вы собираетесь использовать эти тестовые данные для оценки ее производительности впоследствии), поэтому я бы заменил X_test от X_train в вашей первой строке.
Чтобы получить метку для ваших состязательных примеров, вы можете использовать оригинальные метки данных обучения или прогнозы модели на исходных данных обучения model.predict_classes(X_train) (это предполагает, что состязательный пример не достаточно возмущен, чтобы изменить метку ввода).