Dalam tutorial ini, kita akan mengeksplorasi penggunaan adversarial learning ( Goodfellow et al., 2014 ) untuk klasifikasi gambar menggunakan kerangka Neural Structured Learning (NSL).
Ide inti dari adversarial learning adalah untuk melatih model dengan data adversarial-perturbed (disebut contoh adversarial) selain data pelatihan organik. Di mata manusia, contoh-contoh permusuhan ini terlihat sama dengan aslinya tetapi gangguan akan menyebabkan model menjadi bingung dan membuat prediksi atau klasifikasi yang salah. Contoh-contoh permusuhan dibangun untuk secara sengaja menyesatkan model agar membuat prediksi atau klasifikasi yang salah. Dengan pelatihan dengan contoh-contoh seperti itu, model belajar untuk menjadi kuat terhadap gangguan permusuhan saat membuat prediksi.
Dalam tutorial ini, kami mengilustrasikan prosedur penerapan pembelajaran adversarial berikut untuk mendapatkan model yang kuat menggunakan kerangka Pembelajaran Terstruktur Saraf:
- Buat jaringan saraf sebagai model dasar. Dalam tutorial ini, model dasar dibuat dengan API fungsional
; prosedur ini kompatibel dengan model yang dibuat olehtf.keras
sekuensial dan API subkelas juga. Untuk informasi selengkapnya tentang model Keras di TensorFlow, lihat dokumentasi ini . - Bungkus model dasar dengan kelas pembungkus
, yang disediakan oleh kerangka kerja NSL, untuk membuat instancetf.keras.Model
baru. Model baru ini akan memasukkan kerugian adversarial sebagai istilah regularisasi dalam tujuan pelatihannya. - Konversikan contoh dalam data pelatihan ke kamus fitur.
- Latih dan evaluasi model baru.
Rekap untuk Pemula
Ada penjelasan video yang sesuai tentang pembelajaran permusuhan untuk bagian klasifikasi gambar dari seri Youtube Pembelajaran Terstruktur Neural TensorFlow. Di bawah ini, kami telah merangkum konsep-konsep kunci yang dijelaskan dalam video ini, memperluas penjelasan yang diberikan di bagian Ikhtisar di atas.
Kerangka kerja NSL bersama-sama mengoptimalkan fitur gambar dan sinyal terstruktur untuk membantu jaringan saraf belajar lebih baik. Namun, bagaimana jika tidak ada struktur eksplisit yang tersedia untuk melatih jaringan saraf? Tutorial ini menjelaskan satu pendekatan yang melibatkan pembuatan tetangga yang berlawanan (dimodifikasi dari sampel asli) untuk membangun struktur secara dinamis.
Pertama, tetangga yang berlawanan didefinisikan sebagai versi modifikasi dari gambar sampel yang diterapkan dengan gangguan kecil yang menyesatkan jaringan saraf ke dalam menghasilkan klasifikasi yang tidak akurat. Gangguan yang dirancang dengan hati-hati ini biasanya didasarkan pada arah gradien terbalik dan dimaksudkan untuk membingungkan jaringan saraf selama pelatihan. Manusia mungkin tidak dapat membedakan antara gambar sampel dan gambar tetangga yang bermusuhan. Namun, untuk jaringan saraf, gangguan yang diterapkan efektif untuk menghasilkan kesimpulan yang tidak akurat.
Tetangga permusuhan yang dihasilkan kemudian dihubungkan ke sampel, oleh karena itu secara dinamis membangun struktur tepi demi tepi. Dengan menggunakan koneksi ini, jaringan saraf belajar untuk mempertahankan kesamaan antara sampel dan tetangga yang berlawanan sambil menghindari kebingungan akibat kesalahan klasifikasi, sehingga meningkatkan kualitas dan akurasi jaringan saraf secara keseluruhan.
Segmen kode di bawah ini adalah penjelasan tingkat tinggi tentang langkah-langkah yang terlibat sementara sisa tutorial ini membahas lebih dalam dan teknis.
- Baca dan siapkan datanya. Muat set data MNIST dan normalkan nilai fitur agar tetap dalam kisaran [0,1]
import neural_structured_learning as nsl
(x_train, y_train), (x_train, y_train) = tf.keras.datasets.mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0
- Membangun jaringan saraf. Model dasar Sequential Keras digunakan untuk contoh ini.
model = tf.keras.Sequential(...)
- Konfigurasikan model permusuhan. Termasuk hyperparameters: pengganda yang diterapkan pada regularisasi permusuhan, nilai-nilai berbeda yang dipilih secara empiris untuk ukuran langkah/kecepatan pembelajaran. Panggil regularisasi permusuhan dengan kelas pembungkus di sekitar jaringan saraf yang dibangun.
adv_config = nsl.configs.make_adv_reg_config(multiplier=0.2, adv_step_size=0.05)
adv_model = nsl.keras.AdversarialRegularization(model, adv_config)
- Akhiri dengan alur kerja Keras standar: kompilasi, sesuaikan, evaluasi.
adv_model.compile(optimizer='adam', loss='sparse_categorizal_crossentropy', metrics=['accuracy'])
adv_model.fit({'feature': x_train, 'label': y_train}, epochs=5)
adv_model.evaluate({'feature': x_test, 'label': y_test})
Apa yang Anda lihat di sini adalah pembelajaran permusuhan yang diaktifkan dalam 2 langkah dan 3 baris kode sederhana. Ini adalah kesederhanaan kerangka pembelajaran terstruktur saraf. Pada bagian berikut, kami memperluas prosedur ini.
Instal paket Pembelajaran Terstruktur Neural.
pip install --quiet neural-structured-learning
Impor perpustakaan. Kami menyingkat neural_structured_learning
menjadi nsl
import matplotlib.pyplot as plt
import neural_structured_learning as nsl
import numpy as np
import tensorflow as tf
import tensorflow_datasets as tfds
Kami mengumpulkan dan menjelaskan hyperparameters (dalam objek HParams
) untuk pelatihan dan evaluasi model.
Input output:
: Bentuk tensor input. Setiap gambar berukuran 28 kali 28 piksel dengan 1 saluran. -
: Ada total 10 kelas, sesuai dengan 10 digit [0-9].
Model arsitektur:
: Daftar angka, masing-masing menentukan jumlah filter dalam lapisan konvolusi. -
: Ukuran jendela konvolusi 2D, dibagi oleh semua lapisan konvolusi. -
: Faktor untuk menurunkan skala gambar di setiap lapisan max-pooling. -
: Jumlah unit (yaitu, lebar) dari setiap lapisan yang terhubung penuh.
Pelatihan dan evaluasi:
: Ukuran batch yang digunakan untuk pelatihan dan evaluasi. -
: Jumlah epoch pelatihan.
Pembelajaran permusuhan:
: Bobot kerugian adversarial dalam tujuan pelatihan, relatif terhadap kerugian berlabel. -
: Besarnya gangguan permusuhan. -
: Norma untuk mengukur besarnya gangguan permusuhan.
class HParams(object):
def __init__(self):
self.input_shape = [28, 28, 1]
self.num_classes = 10
self.conv_filters = [32, 64, 64]
self.kernel_size = (3, 3)
self.pool_size = (2, 2)
self.num_fc_units = [64]
self.batch_size = 32
self.epochs = 5
self.adv_multiplier = 0.2
self.adv_step_size = 0.2
self.adv_grad_norm = 'infinity'
HPARAMS = HParams()
kumpulan data MNIST
Dataset MNIST berisi gambar skala abu-abu dari angka tulisan tangan (dari '0' hingga '9'). Setiap gambar menunjukkan satu digit pada resolusi rendah (28-kali-28 piksel). Tugas yang terlibat adalah untuk mengklasifikasikan gambar ke dalam 10 kategori, satu per digit.
Di sini kita memuat dataset MNIST dari TensorFlow Datasets . Ini menangani pengunduhan data dan pembuatan tf.data.Dataset
. Dataset yang dimuat memiliki dua subset:
dengan 60.000 contoh, dan -
dengan 10.000 contoh.
Contoh di kedua himpunan bagian disimpan dalam kamus fitur dengan dua kunci berikut:
: Array nilai piksel, mulai dari 0 hingga 255. -
: Label groundtruth, mulai dari 0 hingga 9.
datasets = tfds.load('mnist')
train_dataset = datasets['train']
test_dataset = datasets['test']
Kita dapat melihat bahwa akurasi model dasar turun drastis (dari 99% menjadi sekitar 50%) ketika input terganggu secara berlawanan. Di sisi lain, akurasi model yang diatur dengan permusuhan hanya sedikit menurun (dari 99% menjadi 95%). Hal ini menunjukkan keefektifan pembelajaran adversarial dalam meningkatkan kekokohan model.
Contoh gambar yang terganggu secara permusuhan
Di sini kita melihat gambar-gambar yang terganggu secara permusuhan. Kita dapat melihat bahwa gambar yang terganggu masih menunjukkan angka yang dapat dikenali oleh manusia, tetapi berhasil menipu model dasarnya.
batch_index = 0
batch_image = perturbed_images[batch_index]
batch_label = labels[batch_index]
batch_pred = predictions[batch_index]
batch_size = HPARAMS.batch_size
n_col = 4
n_row = (batch_size + n_col - 1) // n_col
print('accuracy in batch %d:' % batch_index)
for name, pred in batch_pred.items():
print('%s model: %d / %d' % (name, np.sum(batch_label == pred), batch_size))
plt.figure(figsize=(15, 15))
for i, (image, y) in enumerate(zip(batch_image, batch_label)):
y_base = batch_pred['base'][i]
y_adv = batch_pred['adv-regularized'][i]
plt.subplot(n_row, n_col, i+1)
plt.title('true: %d, base: %d, adv: %d' % (y, y_base, y_adv))
plt.imshow(tf.keras.utils.array_to_img(image), cmap='gray')
accuracy in batch 0: base model: 11 / 32 adv-regularized model: 31 / 32
Kami telah mendemonstrasikan penggunaan pembelajaran permusuhan untuk klasifikasi gambar menggunakan kerangka kerja Neural Structured Learning (NSL). Kami mendorong pengguna untuk bereksperimen dengan pengaturan permusuhan yang berbeda (dalam parameter hiper) dan untuk melihat bagaimana pengaruhnya terhadap ketahanan model.