Tổng quat
Trong hướng dẫn này, chúng ta sẽ khám phá việc sử dụng phương pháp học đối nghịch ( Goodfellow et al., 2014 ) để phân loại hình ảnh bằng cách sử dụng khung Neural Structured Learning (NSL).
Ý tưởng cốt lõi của việc học theo đối phương là đào tạo một mô hình với dữ liệu xáo trộn đối nghịch (được gọi là các ví dụ về đối phương) ngoài dữ liệu đào tạo không phải trả tiền. Đối với mắt người, những ví dụ đối nghịch này trông giống như bản gốc nhưng sự nhiễu loạn sẽ khiến mô hình bị nhầm lẫn và đưa ra những dự đoán hoặc phân loại không chính xác. Các ví dụ đối nghịch được xây dựng để cố ý đánh lừa mô hình đưa ra các dự đoán hoặc phân loại sai. Bằng cách đào tạo với các ví dụ như vậy, mô hình học cách mạnh mẽ chống lại sự nhiễu loạn của đối thủ khi đưa ra dự đoán.
Trong hướng dẫn này, chúng tôi minh họa quy trình sau đây áp dụng phương pháp học đối nghịch để có được các mô hình mạnh mẽ bằng cách sử dụng khung Học tập có cấu trúc thần kinh:
- Tạo mạng nơ-ron làm mô hình cơ sở. Trong hướng dẫn này, mô hình cơ sở được tạo bằng API chức năng
; quy trình này cũng tương thích với các mô hình được tạo bởi các API tuần tự và phân lớp củatf.keras
. Để biết thêm thông tin về các mô hình Keras trong TensorFlow, hãy xem tài liệu này. - Bao bọc mô hình cơ sở bằng lớp trình bao bọc
, được cung cấp bởi khung NSL, để tạo một cá thểtf.keras.Model
mới. Mô hình mới này sẽ bao gồm tổn thất đối thủ như một thuật ngữ chính quy hóa trong mục tiêu đào tạo của nó. - Chuyển đổi các ví dụ trong dữ liệu đào tạo thành từ điển tính năng.
- Đào tạo và đánh giá mô hình mới.
Tóm tắt cho người mới bắt đầu
Có một video giải thích tương ứng về cách học đối nghịch cho phần phân loại hình ảnh của loạt video Youtube về Học có cấu trúc thần kinh TensorFlow. Dưới đây, chúng tôi đã tóm tắt các khái niệm chính được giải thích trong video này, mở rộng thêm phần giải thích được cung cấp trong phần Tổng quan ở trên.
Khung NSL cùng nhau tối ưu hóa cả các tính năng hình ảnh và tín hiệu có cấu trúc để giúp các mạng thần kinh học tốt hơn. Tuy nhiên, điều gì sẽ xảy ra nếu không có sẵn cấu trúc rõ ràng để huấn luyện mạng nơ-ron? Hướng dẫn này giải thích một cách tiếp cận liên quan đến việc tạo ra các láng giềng đối nghịch (được sửa đổi từ mẫu ban đầu) để xây dựng một cấu trúc động.
Thứ nhất, các láng giềng đối nghịch được định nghĩa là các phiên bản đã sửa đổi của hình ảnh mẫu được áp dụng với các nhiễu loạn nhỏ làm sai lệch mạng nơ-ron tạo ra các phân loại không chính xác. Những nhiễu loạn được thiết kế cẩn thận này thường dựa trên hướng ngược của gradient và có nghĩa là gây nhầm lẫn cho mạng thần kinh trong quá trình đào tạo. Con người có thể không phân biệt được sự khác biệt giữa hình ảnh mẫu và hình ảnh hàng xóm thù địch được tạo ra. Tuy nhiên, đối với mạng lưới thần kinh, các nhiễu loạn được áp dụng có hiệu quả dẫn đến kết luận không chính xác.
Các lân cận đối nghịch được tạo ra sau đó được kết nối với mẫu, do đó xây dựng động từng cạnh của cấu trúc. Sử dụng kết nối này, mạng nơ-ron học cách duy trì sự tương đồng giữa mẫu và các đối thủ cạnh tranh trong khi tránh nhầm lẫn do phân loại sai, do đó cải thiện chất lượng và độ chính xác của mạng nơ-ron tổng thể.
Đoạn mã dưới đây là phần giải thích cấp cao về các bước liên quan trong khi phần còn lại của hướng dẫn này đi sâu hơn vào tính kỹ thuật và chuyên sâu.
- Đọc và chuẩn bị dữ liệu. Tải tập dữ liệu MNIST và chuẩn hóa các giá trị của đối tượng địa lý để nằm trong phạm vi [0,1]
import neural_structured_learning as nsl
(x_train, y_train), (x_train, y_train) = tf.keras.datasets.mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0
- Xây dựng mạng nơ-ron. Một mô hình cơ sở Keras tuần tự được sử dụng cho ví dụ này.
model = tf.keras.Sequential(...)
- Cấu hình mô hình đối thủ. Bao gồm các siêu tham số: hệ số được áp dụng trên chính quy đối phương, các giá trị khác nhau được chọn theo kinh nghiệm cho kích thước bước / tốc độ học. Gọi chính quy đối nghịch với một lớp bao bọc xung quanh mạng nơ-ron đã xây dựng.
adv_config = nsl.configs.make_adv_reg_config(multiplier=0.2, adv_step_size=0.05)
adv_model = nsl.keras.AdversarialRegularization(model, adv_config)
- Kết luận với quy trình làm việc Keras tiêu chuẩn: biên dịch, điều chỉnh, đánh giá.
adv_model.compile(optimizer='adam', loss='sparse_categorizal_crossentropy', metrics=['accuracy'])
adv_model.fit({'feature': x_train, 'label': y_train}, epochs=5)
adv_model.evaluate({'feature': x_test, 'label': y_test})
Những gì bạn thấy ở đây là học đối thủ được kích hoạt trong 2 bước và 3 dòng mã đơn giản. Đây là sự đơn giản của khung học tập có cấu trúc thần kinh. Trong các phần sau, chúng tôi mở rộng quy trình này.
Thành lập
Cài đặt gói Học có cấu trúc thần kinh.
pip install --quiet neural-structured-learning
Nhập thư viện. Chúng tôi viết tắt neural_structured_learning
thành nsl
import matplotlib.pyplot as plt
import neural_structured_learning as nsl
import numpy as np
import tensorflow as tf
import tensorflow_datasets as tfds
Siêu tham số
Chúng tôi thu thập và giải thích các siêu tham số (trong một đối tượng HParams
) để đào tạo và đánh giá mô hình.
Đầu ra đầu vào:
: Hình dạng của tensor đầu vào. Mỗi hình ảnh có kích thước 28 x 28 pixel với 1 kênh. -
: Có tổng cộng 10 lớp, tương ứng với 10 chữ số [0-9].
Kiến trúc mô hình:
: Một danh sách các số, mỗi số chỉ định số lượng bộ lọc trong một lớp chập. -
: Kích thước của cửa sổ tích chập 2D, được chia sẻ bởi tất cả các lớp tích chập. -
: Các yếu tố để giảm tỷ lệ hình ảnh trong mỗi lớp gộp tối đa. -
: Số lượng đơn vị (tức là chiều rộng) của mỗi lớp được kết nối đầy đủ.
Đào tạo và đánh giá:
: Kích thước lô được sử dụng để đào tạo và đánh giá. -
: Số kỷ nguyên đào tạo.
Học tập bất lợi:
: Trọng số của tổn thất đối nghịch trong mục tiêu đào tạo, so với tổn thất được dán nhãn. -
: Mức độ nhiễu loạn của đối thủ. -
: Chuẩn mực để đo mức độ của nhiễu loạn đối nghịch.
class HParams(object):
def __init__(self):
self.input_shape = [28, 28, 1]
self.num_classes = 10
self.conv_filters = [32, 64, 64]
self.kernel_size = (3, 3)
self.pool_size = (2, 2)
self.num_fc_units = [64]
self.batch_size = 32
self.epochs = 5
self.adv_multiplier = 0.2
self.adv_step_size = 0.2
self.adv_grad_norm = 'infinity'
HPARAMS = HParams()
Tập dữ liệu MNIST
Tập dữ liệu MNIST chứa các hình ảnh thang độ xám của các chữ số viết tay (từ '0' đến '9'). Mỗi hình ảnh hiển thị một chữ số ở độ phân giải thấp (28 x 28 pixel). Nhiệm vụ liên quan là phân loại hình ảnh thành 10 loại, mỗi loại một chữ số.
Ở đây chúng tôi tải tập dữ liệu MNIST từ Tập dữ liệu TensorFlow . Nó xử lý việc tải xuống dữ liệu và xây dựng một tf.data.Dataset
. Tập dữ liệu đã tải có hai tập con:
với 60.000 ví dụ, và -
với 10.000 ví dụ.
Ví dụ trong cả hai tập hợp con được lưu trữ trong từ điển tính năng với hai khóa sau:
: Mảng giá trị pixel, nằm trong khoảng từ 0 đến 255. -
: Nhãn Groundtruth, nằm trong khoảng từ 0 đến 9.
datasets = tfds.load('mnist')
train_dataset = datasets['train']
test_dataset = datasets['test']
2022-01-05 12:23:33.651944: E tensorflow/stream_executor/cuda/cuda_driver.cc:271] failed call to cuInit: CUDA_ERROR_NO_DEVICE: no CUDA-capable device is detected
Để làm cho mô hình ổn định về mặt số học, chúng tôi chuẩn hóa các giá trị pixel thành [0, 1] bằng cách ánh xạ tập dữ liệu qua hàm normalize
. Sau khi xáo trộn tập huấn luyện và theo lô, chúng tôi chuyển đổi các ví dụ thành các bộ giá trị đặc trưng (image, label)
để huấn luyện mô hình cơ sở. Chúng tôi cũng cung cấp chức năng chuyển đổi từ bộ từ sang từ điển để sử dụng sau này.
def normalize(features):
features[IMAGE_INPUT_NAME] = tf.cast(
features[IMAGE_INPUT_NAME], dtype=tf.float32) / 255.0
return features
def convert_to_tuples(features):
return features[IMAGE_INPUT_NAME], features[LABEL_INPUT_NAME]
def convert_to_dictionaries(image, label):
return {IMAGE_INPUT_NAME: image, LABEL_INPUT_NAME: label}
train_dataset = train_dataset.map(normalize).shuffle(10000).batch(HPARAMS.batch_size).map(convert_to_tuples)
test_dataset = test_dataset.map(normalize).batch(HPARAMS.batch_size).map(convert_to_tuples)
Mô hình cơ sở
Mô hình cơ sở của chúng tôi sẽ là một mạng nơ-ron bao gồm 3 lớp phức hợp được tạo thành bởi 2 lớp được kết nối đầy đủ (như được định nghĩa trong HPARAMS
). Ở đây chúng tôi xác định nó bằng cách sử dụng API chức năng Keras. Hãy thử các API hoặc kiến trúc mô hình khác (ví dụ: phân lớp). Lưu ý rằng khung NSL hỗ trợ cả ba loại API Keras.
def build_base_model(hparams):
"""Builds a model according to the architecture defined in `hparams`."""
inputs = tf.keras.Input(
shape=hparams.input_shape, dtype=tf.float32, name=IMAGE_INPUT_NAME)
x = inputs
for i, num_filters in enumerate(hparams.conv_filters):
x = tf.keras.layers.Conv2D(
num_filters, hparams.kernel_size, activation='relu')(
if i < len(hparams.conv_filters) - 1:
# max pooling between convolutional layers
x = tf.keras.layers.MaxPooling2D(hparams.pool_size)(x)
x = tf.keras.layers.Flatten()(x)
for num_units in hparams.num_fc_units:
x = tf.keras.layers.Dense(num_units, activation='relu')(x)
pred = tf.keras.layers.Dense(hparams.num_classes)(x)
model = tf.keras.Model(inputs=inputs, outputs=pred)
return model
base_model = build_base_model(HPARAMS)
Model: "model" _________________________________________________________________ Layer (type) Output Shape Param # ================================================================= image (InputLayer) [(None, 28, 28, 1)] 0 conv2d (Conv2D) (None, 26, 26, 32) 320 max_pooling2d (MaxPooling2D (None, 13, 13, 32) 0 ) conv2d_1 (Conv2D) (None, 11, 11, 64) 18496 max_pooling2d_1 (MaxPooling (None, 5, 5, 64) 0 2D) conv2d_2 (Conv2D) (None, 3, 3, 64) 36928 flatten (Flatten) (None, 576) 0 dense (Dense) (None, 64) 36928 dense_1 (Dense) (None, 10) 650 ================================================================= Total params: 93,322 Trainable params: 93,322 Non-trainable params: 0 _________________________________________________________________
Tiếp theo, chúng tôi đào tạo và đánh giá mô hình cơ sở.
base_model.fit(train_dataset, epochs=HPARAMS.epochs)
Epoch 1/5 1875/1875 [==============================] - 15s 7ms/step - loss: 0.1412 - acc: 0.9553 Epoch 2/5 1875/1875 [==============================] - 13s 7ms/step - loss: 0.0464 - acc: 0.9853 Epoch 3/5 1875/1875 [==============================] - 13s 7ms/step - loss: 0.0335 - acc: 0.9896 Epoch 4/5 1875/1875 [==============================] - 13s 7ms/step - loss: 0.0267 - acc: 0.9914 Epoch 5/5 1875/1875 [==============================] - 13s 7ms/step - loss: 0.0199 - acc: 0.9937 <keras.callbacks.History at 0x7f04504de3d0>
results = base_model.evaluate(test_dataset)
named_results = dict(zip(base_model.metrics_names, results))
print('\naccuracy:', named_results['acc'])
313/313 [==============================] - 1s 3ms/step - loss: 0.0360 - acc: 0.9891 accuracy: 0.9890999794006348
Chúng ta có thể thấy rằng mô hình cơ sở đạt được độ chính xác 99% trên bộ thử nghiệm. Chúng ta sẽ xem nó mạnh mẽ như thế nào trong Robustness Under Adversarial Perturbations bên dưới.
Mô hình đối nghịch-chính quy
Dưới đây chúng tôi chỉ ra cách kết hợp đào tạo đối thủ vào mô hình Keras với một vài dòng mã, sử dụng khung NSL. Mô hình cơ sở được bao bọc để tạo ra một tf.Keras.Model
mới, có mục tiêu đào tạo bao gồm chính quy hóa đối thủ.
Đầu tiên, chúng tôi tạo một đối tượng cấu hình với tất cả các siêu tham số có liên quan bằng cách sử dụng hàm trợ giúp nsl.configs.make_adv_reg_config
adv_config = nsl.configs.make_adv_reg_config(
Bây giờ chúng ta có thể bao bọc một mô hình cơ sở với AdversarialRegularization
. Ở đây chúng tôi tạo một mô hình cơ sở mới ( base_adv_model
), để mô hình hiện có ( base_model
) có thể được sử dụng để so sánh sau này.
trả về là một đối tượng tf.keras.Model
, có mục tiêu đào tạo bao gồm một điều khoản chính thức hóa cho tổn thất đối thủ. Để tính toán sự mất mát đó, mô hình phải có quyền truy cập vào thông tin nhãn ( label
tính năng), ngoài đầu vào thông thường ( image
đặc trưng). Vì lý do này, chúng tôi chuyển đổi các ví dụ trong bộ dữ liệu từ bộ dữ liệu trở lại từ điển. Và chúng tôi cho mô hình biết tính năng nào chứa thông tin nhãn thông qua tham số label_keys
base_adv_model = build_base_model(HPARAMS)
adv_model = nsl.keras.AdversarialRegularization(
train_set_for_adv_model = train_dataset.map(convert_to_dictionaries)
test_set_for_adv_model = test_dataset.map(convert_to_dictionaries)
Tiếp theo, chúng tôi biên dịch, đào tạo và đánh giá mô hình đối nghịch-chính quy hóa. Có thể có cảnh báo như "Thiếu đầu ra trong từ điển tổn thất", điều này không sao cả vì adv_model
không dựa vào việc triển khai cơ sở để tính toán tổng số tổn thất.
adv_model.fit(train_set_for_adv_model, epochs=HPARAMS.epochs)
Epoch 1/5 WARNING:tensorflow:The dtype of the watched tensor must be floating (e.g. tf.float32), got tf.int64 WARNING:tensorflow:The dtype of the watched tensor must be floating (e.g. tf.float32), got tf.int64 WARNING:tensorflow:The dtype of the source tensor must be floating (e.g. tf.float32) when calling GradientTape.gradient, got tf.int64 WARNING:tensorflow:The dtype of the source tensor must be floating (e.g. tf.float32) when calling GradientTape.gradient, got tf.int64 WARNING:tensorflow:AutoGraph could not transform <bound method Socket.send of <zmq.Socket(zmq.PUSH) at 0x7f0510bd97c0>> and will run it as-is. Please report this to the TensorFlow team. When filing the bug, set the verbosity to 10 (on Linux, `export AUTOGRAPH_VERBOSITY=10`) and attach the full output. Cause: module, class, method, function, traceback, frame, or code object was expected, got cython_function_or_method To silence this warning, decorate the function with @tf.autograph.experimental.do_not_convert WARNING:absl:Cannot perturb features dict_keys(['label']) WARNING:tensorflow:AutoGraph could not transform <bound method Socket.send of <zmq.Socket(zmq.PUSH) at 0x7f0510bd97c0>> and will run it as-is. Please report this to the TensorFlow team. When filing the bug, set the verbosity to 10 (on Linux, `export AUTOGRAPH_VERBOSITY=10`) and attach the full output. Cause: module, class, method, function, traceback, frame, or code object was expected, got cython_function_or_method To silence this warning, decorate the function with @tf.autograph.experimental.do_not_convert WARNING: AutoGraph could not transform <bound method Socket.send of <zmq.Socket(zmq.PUSH) at 0x7f0510bd97c0>> and will run it as-is. Please report this to the TensorFlow team. When filing the bug, set the verbosity to 10 (on Linux, `export AUTOGRAPH_VERBOSITY=10`) and attach the full output. Cause: module, class, method, function, traceback, frame, or code object was expected, got cython_function_or_method To silence this warning, decorate the function with @tf.autograph.experimental.do_not_convert WARNING:tensorflow:The dtype of the watched tensor must be floating (e.g. tf.float32), got tf.int64 WARNING:tensorflow:The dtype of the watched tensor must be floating (e.g. tf.float32), got tf.int64 WARNING:tensorflow:The dtype of the source tensor must be floating (e.g. tf.float32) when calling GradientTape.gradient, got tf.int64 WARNING:tensorflow:The dtype of the source tensor must be floating (e.g. tf.float32) when calling GradientTape.gradient, got tf.int64 1875/1875 [==============================] - 28s 12ms/step - loss: 0.2907 - sparse_categorical_crossentropy: 0.1354 - sparse_categorical_accuracy: 0.9587 - scaled_adversarial_loss: 0.1553 Epoch 2/5 1875/1875 [==============================] - 22s 12ms/step - loss: 0.1194 - sparse_categorical_crossentropy: 0.0408 - sparse_categorical_accuracy: 0.9873 - scaled_adversarial_loss: 0.0786 Epoch 3/5 1875/1875 [==============================] - 22s 12ms/step - loss: 0.0835 - sparse_categorical_crossentropy: 0.0293 - sparse_categorical_accuracy: 0.9909 - scaled_adversarial_loss: 0.0542 Epoch 4/5 1875/1875 [==============================] - 22s 12ms/step - loss: 0.0610 - sparse_categorical_crossentropy: 0.0240 - sparse_categorical_accuracy: 0.9923 - scaled_adversarial_loss: 0.0370 Epoch 5/5 1875/1875 [==============================] - 22s 12ms/step - loss: 0.0516 - sparse_categorical_crossentropy: 0.0186 - sparse_categorical_accuracy: 0.9941 - scaled_adversarial_loss: 0.0330 <keras.callbacks.History at 0x7f0428125790>
results = adv_model.evaluate(test_set_for_adv_model)
named_results = dict(zip(adv_model.metrics_names, results))
print('\naccuracy:', named_results['sparse_categorical_accuracy'])
WARNING:tensorflow:The dtype of the watched tensor must be floating (e.g. tf.float32), got tf.int64 WARNING:tensorflow:The dtype of the watched tensor must be floating (e.g. tf.float32), got tf.int64 WARNING:tensorflow:The dtype of the source tensor must be floating (e.g. tf.float32) when calling GradientTape.gradient, got tf.int64 WARNING:tensorflow:The dtype of the source tensor must be floating (e.g. tf.float32) when calling GradientTape.gradient, got tf.int64 313/313 [==============================] - 2s 7ms/step - loss: 0.0617 - sparse_categorical_crossentropy: 0.0253 - sparse_categorical_accuracy: 0.9923 - scaled_adversarial_loss: 0.0364 accuracy: 0.9922999739646912
Chúng ta có thể thấy rằng mô hình đối nghịch-điều chỉnh cũng hoạt động rất tốt (độ chính xác 99%) trên bộ thử nghiệm.
Mạnh mẽ dưới sự xáo trộn của đối thủ
Bây giờ chúng ta so sánh mô hình cơ sở và mô hình quy định đối nghịch về độ mạnh mẽ dưới sự nhiễu loạn của đối thủ.
Chúng tôi sẽ sử dụng hàm AdversarialRegularization.perturb_on_batch
để tạo các ví dụ bất ổn đối nghịch. Và chúng tôi muốn thế hệ dựa trên mô hình cơ sở. Để làm như vậy, chúng tôi kết hợp mô hình cơ sở với AdversarialRegularization
. Lưu ý rằng miễn là chúng ta không gọi đào tạo ( Model.fit
), các biến đã học trong mô hình sẽ không thay đổi và mô hình vẫn giống như trong phần Mô hình cơ sở .
reference_model = nsl.keras.AdversarialRegularization(
base_model, label_keys=[LABEL_INPUT_NAME], adv_config=adv_config)
Chúng tôi thu thập trong từ điển các mô hình được đánh giá và cũng tạo đối tượng chỉ số cho từng mô hình.
Lưu ý rằng chúng tôi lấy adv_model.base_model
để có cùng định dạng đầu vào (không yêu cầu thông tin nhãn) như mô hình cơ sở. Các biến đã học trong adv_model.base_model
giống như các biến trong adv_model
models_to_eval = {
'base': base_model,
'adv-regularized': adv_model.base_model
metrics = {
name: tf.keras.metrics.SparseCategoricalAccuracy()
for name in models_to_eval.keys()
Đây là vòng lặp để tạo ra các ví dụ bị xáo trộn và để đánh giá các mô hình với chúng. Chúng tôi lưu các hình ảnh, nhãn và dự đoán bị xáo trộn để dễ hình dung trong phần tiếp theo.
perturbed_images, labels, predictions = [], [], []
for batch in test_set_for_adv_model:
perturbed_batch = reference_model.perturb_on_batch(batch)
# Clipping makes perturbed examples have the same range as regular ones.
perturbed_batch[IMAGE_INPUT_NAME] = tf.clip_by_value(
perturbed_batch[IMAGE_INPUT_NAME], 0.0, 1.0)
y_true = perturbed_batch.pop(LABEL_INPUT_NAME)
for name, model in models_to_eval.items():
y_pred = model(perturbed_batch)
metrics[name](y_true, y_pred)
predictions[-1][name] = tf.argmax(y_pred, axis=-1).numpy()
for name, metric in metrics.items():
print('%s model accuracy: %f' % (name, metric.result().numpy()))
Chúng ta có thể thấy rằng độ chính xác của mô hình cơ sở giảm đáng kể (từ 99% xuống còn khoảng 50%) khi đầu vào bị xáo trộn bất lợi. Mặt khác, độ chính xác của mô hình đối nghịch-quy định chỉ giảm một chút (từ 99% xuống 95%). Điều này chứng tỏ hiệu quả của việc học hỏi đối thủ trong việc cải thiện tính mạnh mẽ của mô hình.
Ví dụ về hình ảnh nhiễu loạn đối nghịch
Sau đây, chúng ta hãy xem những hình ảnh xáo trộn của đối thủ. Chúng ta có thể thấy rằng các hình ảnh nhiễu loạn vẫn hiển thị các chữ số mà con người có thể nhận ra, nhưng có thể đánh lừa thành công mô hình cơ sở.
batch_index = 0
batch_image = perturbed_images[batch_index]
batch_label = labels[batch_index]
batch_pred = predictions[batch_index]
batch_size = HPARAMS.batch_size
n_col = 4
n_row = (batch_size + n_col - 1) // n_col
print('accuracy in batch %d:' % batch_index)
for name, pred in batch_pred.items():
print('%s model: %d / %d' % (name, np.sum(batch_label == pred), batch_size))
plt.figure(figsize=(15, 15))
for i, (image, y) in enumerate(zip(batch_image, batch_label)):
y_base = batch_pred['base'][i]
y_adv = batch_pred['adv-regularized'][i]
plt.subplot(n_row, n_col, i+1)
plt.title('true: %d, base: %d, adv: %d' % (y, y_base, y_adv))
plt.imshow(tf.keras.utils.array_to_img(image), cmap='gray')
accuracy in batch 0: base model: 11 / 32 adv-regularized model: 31 / 32
Sự kết luận
Chúng tôi đã chứng minh việc sử dụng phương pháp học đối nghịch để phân loại hình ảnh bằng cách sử dụng khung Học tập có cấu trúc thần kinh (NSL). Chúng tôi khuyến khích người dùng thử nghiệm với các cài đặt đối nghịch khác nhau (trong siêu thông số) và để xem chúng ảnh hưởng như thế nào đến độ bền của mô hình.