Czy kiedykolwiek widziałeś piękny kwiat i zastanawiałeś się, co to za kwiat? Cóż, nie jesteś pierwszy, więc zbudujmy sposób na identyfikację rodzaju kwiatu ze zdjęcia!
Klasyfikacji obrazów, szczególny rodzaj głębokiej sieci neuronowej, zwany splotowego sieć neuronowa okazał się szczególnie silny. Jednak współczesne splotowe sieci neuronowe mają miliony parametrów. Trenowanie ich od zera wymaga wielu oznaczonych danych treningowych i dużej mocy obliczeniowej (setki godzin pracy GPU lub więcej). Mamy tylko około trzech tysięcy oznaczonych zdjęć i chcemy spędzić znacznie mniej czasu, więc musimy być sprytniejsi.
Będziemy wykorzystywać technikę zwaną naukę transferu gdzie bierzemy sieć wstępnie przeszkolony (wyszkolony na około milion ogólnych zdjęć), użyj go, aby wyodrębnić cechy, a trenować nową warstwę na wierzchu dla naszego zadania klasyfikacji obrazów kwiatów.
import collections
import io
import math
import os
import random
from six.moves import urllib
from IPython.display import clear_output, Image, display, HTML
import tensorflow.compat.v1 as tf
import tensorflow_hub as hub
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import sklearn.metrics as sk_metrics
import time
Zbiór danych o kwiatach
Zbiór danych kwiatów składa się z obrazów kwiatów z 5 możliwymi etykietami klas.
Podczas trenowania modelu uczenia maszynowego dzielimy nasze dane na zestawy danych treningowych i testowych. Wytrenujemy model na naszych danych treningowych, a następnie ocenimy, jak dobrze model działa na danych, których nigdy nie widział — na zestawie testowym.
Pobierzmy nasze przykłady treningowe i testowe (może to chwilę potrwać) i podzielmy je na zestawy treningowe i testowe.
Uruchom następujące dwie komórki:
FLOWERS_DIR = './flower_photos'
def download_images():
"""If the images aren't already downloaded, save them to FLOWERS_DIR."""
if not os.path.exists(FLOWERS_DIR):
DOWNLOAD_URL = 'http://download.tensorflow.org/example_images/flower_photos.tgz'
print('Downloading flower images from %s...' % DOWNLOAD_URL)
urllib.request.urlretrieve(DOWNLOAD_URL, 'flower_photos.tgz')
!tar xfz flower_photos.tgz
print('Flower photos are located in %s' % FLOWERS_DIR)
def make_train_and_test_sets():
"""Split the data into train and test sets and get the label classes."""
train_examples, test_examples = [], []
shuffler = random.Random(RANDOM_SEED)
is_root = True
for (dirname, subdirs, filenames) in tf.gfile.Walk(FLOWERS_DIR):
# The root directory gives us the classes
if is_root:
subdirs = sorted(subdirs)
classes = collections.OrderedDict(enumerate(subdirs))
label_to_class = dict([(x, i) for i, x in enumerate(subdirs)])
is_root = False
# The sub directories give us the image files for training.
full_filenames = [os.path.join(dirname, f) for f in filenames]
label = dirname.split('/')[-1]
label_class = label_to_class[label]
# An example is the image file and it's label class.
examples = list(zip(full_filenames, [label_class] * len(filenames)))
num_train = int(len(filenames) * TRAIN_FRACTION)
return train_examples, test_examples, classes
# Download the images and split the images into train and test sets.
TRAIN_EXAMPLES, TEST_EXAMPLES, CLASSES = make_train_and_test_sets()
print('\nThe dataset has %d label classes: %s' % (NUM_CLASSES, CLASSES.values()))
print('There are %d training images' % len(TRAIN_EXAMPLES))
print('there are %d test images' % len(TEST_EXAMPLES))
Downloading flower images from http://download.tensorflow.org/example_images/flower_photos.tgz... Flower photos are located in ./flower_photos The dataset has 5 label classes: odict_values(['daisy', 'dandelion', 'roses', 'sunflowers', 'tulips']) There are 2934 training images there are 736 test images
Przeglądaj dane
Zbiór danych o kwiatach składa się z przykładów oznaczonych jako obrazy kwiatów. Każdy przykład zawiera obraz kwiatu JPEG i etykietę klasy: jaki to jest rodzaj kwiatu. Wyświetlmy kilka zdjęć wraz z ich etykietami.
Pokaż kilka oznaczonych obrazów
def get_label(example):
"""Get the label (number) for given example."""
return example[1]
def get_class(example):
"""Get the class (string) of given example."""
return CLASSES[get_label(example)]
def get_encoded_image(example):
"""Get the image data (encoded jpg) of given example."""
image_path = example[0]
return tf.gfile.GFile(image_path, 'rb').read()
def get_image(example):
"""Get image as np.array of pixels for given example."""
return plt.imread(io.BytesIO(get_encoded_image(example)), format='jpg')
def display_images(images_and_classes, cols=5):
"""Display given images and their labels in a grid."""
rows = int(math.ceil(len(images_and_classes) / cols))
fig = plt.figure()
fig.set_size_inches(cols * 3, rows * 3)
for i, (image, flower_class) in enumerate(images_and_classes):
plt.subplot(rows, cols, i + 1)
display_images([(get_image(example), get_class(example))
for example in TRAIN_EXAMPLES[:NUM_IMAGES]])
Zbuduj model
Będziemy załadować TF-Hub moduł funkcja obraz wektorowy, stos liniowego klasyfikatora na nim, i dodać szkoleniowych i ewaluacji PO. Następująca komórka tworzy wykres TF opisujący model i jego szkolenie, ale nie uruchamia szkolenia (to będzie następny krok).
# Load a pre-trained TF-Hub module for extracting features from images. We've
# chosen this particular module for speed, but many other choices are available.
image_module = hub.Module('https://tfhub.dev/google/imagenet/mobilenet_v2_035_128/feature_vector/2')
# Preprocessing images into tensors with size expected by the image module.
encoded_images = tf.placeholder(tf.string, shape=[None])
image_size = hub.get_expected_image_size(image_module)
def decode_and_resize_image(encoded):
decoded = tf.image.decode_jpeg(encoded, channels=3)
decoded = tf.image.convert_image_dtype(decoded, tf.float32)
return tf.image.resize_images(decoded, image_size)
batch_images = tf.map_fn(decode_and_resize_image, encoded_images, dtype=tf.float32)
# The image module can be applied as a function to extract feature vectors for a
# batch of images.
features = image_module(batch_images)
def create_model(features):
"""Build a model for classification from extracted features."""
# Currently, the model is just a single linear layer. You can try to add
# another layer, but be careful... two linear layers (when activation=None)
# are equivalent to a single linear layer. You can create a nonlinear layer
# like this:
# layer = tf.layers.dense(inputs=..., units=..., activation=tf.nn.relu)
layer = tf.layers.dense(inputs=features, units=NUM_CLASSES, activation=None)
return layer
# For each class (kind of flower), the model outputs some real number as a score
# how much the input resembles this class. This vector of numbers is often
# called the "logits".
logits = create_model(features)
labels = tf.placeholder(tf.float32, [None, NUM_CLASSES])
# Mathematically, a good way to measure how much the predicted probabilities
# diverge from the truth is the "cross-entropy" between the two probability
# distributions. For numerical stability, this is best done directly from the
# logits, not the probabilities extracted from them.
cross_entropy = tf.nn.softmax_cross_entropy_with_logits_v2(logits=logits, labels=labels)
cross_entropy_mean = tf.reduce_mean(cross_entropy)
# Let's add an optimizer so we can train the network.
optimizer = tf.train.GradientDescentOptimizer(learning_rate=LEARNING_RATE)
train_op = optimizer.minimize(loss=cross_entropy_mean)
# The "softmax" function transforms the logits vector into a vector of
# probabilities: non-negative numbers that sum up to one, and the i-th number
# says how likely the input comes from class i.
probabilities = tf.nn.softmax(logits)
# We choose the highest one as the predicted class.
prediction = tf.argmax(probabilities, 1)
correct_prediction = tf.equal(prediction, tf.argmax(labels, 1))
# The accuracy will allow us to eval on our test set.
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
Trenuj sieć
Teraz, kiedy nasz model jest już zbudowany, wytrenujmy go i zobaczmy, jak radzi sobie na naszym zestawie testowym.
# How long will we train the network (number of batches).
# How many training examples we use in each step.
# How often to evaluate the model performance.
def get_batch(batch_size=None, test=False):
"""Get a random batch of examples."""
examples = TEST_EXAMPLES if test else TRAIN_EXAMPLES
batch_examples = random.sample(examples, batch_size) if batch_size else examples
return batch_examples
def get_images_and_labels(batch_examples):
images = [get_encoded_image(e) for e in batch_examples]
one_hot_labels = [get_label_one_hot(e) for e in batch_examples]
return images, one_hot_labels
def get_label_one_hot(example):
"""Get the one hot encoding vector for the example."""
one_hot_vector = np.zeros(NUM_CLASSES)
np.put(one_hot_vector, get_label(example), 1)
return one_hot_vector
with tf.Session() as sess:
for i in range(NUM_TRAIN_STEPS):
# Get a random batch of training examples.
train_batch = get_batch(batch_size=TRAIN_BATCH_SIZE)
batch_images, batch_labels = get_images_and_labels(train_batch)
# Run the train_op to train the model.
train_loss, _, train_accuracy = sess.run(
[cross_entropy_mean, train_op, accuracy],
feed_dict={encoded_images: batch_images, labels: batch_labels})
is_final_step = (i == (NUM_TRAIN_STEPS - 1))
if i % EVAL_EVERY == 0 or is_final_step:
# Get a batch of test examples.
test_batch = get_batch(batch_size=None, test=True)
batch_images, batch_labels = get_images_and_labels(test_batch)
# Evaluate how well our model performs on the test set.
test_loss, test_accuracy, test_prediction, correct_predicate = sess.run(
[cross_entropy_mean, accuracy, prediction, correct_prediction],
feed_dict={encoded_images: batch_images, labels: batch_labels})
print('Test accuracy at step %s: %.2f%%' % (i, (test_accuracy * 100)))
Test accuracy at step 0: 22.01% Test accuracy at step 10: 52.04% Test accuracy at step 20: 63.99% Test accuracy at step 30: 69.97% Test accuracy at step 40: 74.59% Test accuracy at step 50: 75.00% Test accuracy at step 60: 75.00% Test accuracy at step 70: 78.26% Test accuracy at step 80: 80.98% Test accuracy at step 90: 79.21% Test accuracy at step 99: 80.30%
def show_confusion_matrix(test_labels, predictions):
"""Compute confusion matrix and normalize."""
confusion = sk_metrics.confusion_matrix(
np.argmax(test_labels, axis=1), predictions)
confusion_normalized = confusion.astype("float") / confusion.sum(axis=1)
axis_labels = list(CLASSES.values())
ax = sns.heatmap(
confusion_normalized, xticklabels=axis_labels, yticklabels=axis_labels,
cmap='Blues', annot=True, fmt='.2f', square=True)
plt.title("Confusion matrix")
plt.ylabel("True label")
plt.xlabel("Predicted label")
show_confusion_matrix(batch_labels, test_prediction)
Błędne przewidywania
Przyjrzyjmy się bliżej przykładom testów, w których nasz model się pomylił.
- Czy w naszym zestawie testowym są jakieś błędnie oznakowane przykłady?
- Czy w zestawie testowym są jakieś złe dane - obrazy, które w rzeczywistości nie są zdjęciami kwiatów?
- Czy są zdjęcia, na których można zrozumieć, dlaczego modelka popełniła błąd?
incorrect = [
(example, CLASSES[prediction])
for example, prediction, is_correct in zip(test_batch, test_prediction, correct_predicate)
if not is_correct
[(get_image(example), "prediction: {0}\nlabel:{1}".format(incorrect_prediction, get_class(example)))
for (example, incorrect_prediction) in incorrect[:20]])
Ćwiczenia: Ulepsz model!
Przeszkoliliśmy model podstawowy, teraz spróbujmy go ulepszyć, aby uzyskać lepszą dokładność. (Pamiętaj, że po wprowadzeniu zmiany konieczne będzie ponowne uruchomienie komórek).
Ćwiczenie 1: Wypróbuj inny model obrazu.
Dzięki TF-Hub wypróbowanie kilku różnych modeli obrazu jest proste. Wystarczy wymienić "https://tfhub.dev/google/imagenet/mobilenet_v2_050_128/feature_vector/2"
uchwyt w hub.Module()
rozmowy z uchwytem z innego modułu i ponownie cały kod. Można zobaczyć wszystkie dostępne moduły graficzne w tfhub.dev .
Dobrym wyborem może być jeden z pozostałych modułów MobileNet V2 . Wiele z tych modułów - w tym MobileNet moduły - szkolono na IMAGEnet zbiór danych , która zawiera ponad 1 milion zdjęć i 1000 klas. Wybór architektury sieci zapewnia kompromis między szybkością a dokładnością klasyfikacji: modele takie jak MobileNet lub NASNet Mobile są szybkie i małe, bardziej tradycyjne architektury, takie jak Inception i ResNet, zostały zaprojektowane z myślą o dokładności.
Dla większej Incepcja V3 architekturze, można również zbadać zalety wstępnego szkolenia w domenie bliżej swojego zadania: jest także dostępny jako moduł przeszkolony na iNaturalist zbiorze roślin i zwierząt.
Ćwiczenie 2: Dodaj ukrytą warstwę.
Stosu ukrytej warstwie pomiędzy wyekstrahowanych cech obrazu i klasyfikatorze liniowym (w funkcji create_model()
powyżej). Aby utworzyć nieliniowej ukryte warstwę przykład 100 węzłów, zastosowanie tf.layers.dense z jednostek ustawiona 100 i aktywacja zestawu do tf.nn.relu
. Czy zmiana rozmiaru ukrytej warstwy wpływa na dokładność testu? Czy dodanie drugiej ukrytej warstwy poprawia dokładność?
Ćwiczenie 3: Zmień hiperparametry.
Czy zwiększenie liczby etapów szkoleniowych poprawia ostateczną dokładność? Można zmienić szybkość uczenia się do szybszego wprowadzania danego modelu Converge? Czy szkolenie wielkość partii wpłynąć na wydajność modelu?
Ćwiczenie 4: Wypróbuj inny optymalizator.
Wymień podstawowe GradientDescentOptimizer z bardziej wyrafinowana optymalizator, np AdagradOptimizer . Czy ma to wpływ na trening modeli? Jeśli chcesz dowiedzieć się więcej o korzyściach płynących z różnych algorytmów optymalizacyjnych, sprawdź ten post .
Chcesz dowiedzieć się więcej?
Jeśli jesteś zainteresowany w bardziej zaawansowaną wersję tego poradnika, sprawdź obraz TensorFlow przekwalifikowania samouczek , który poprowadzi Cię przez wizualizacji szkolenie korzystając TensorBoard, zaawansowanych technik, takich jak zestaw danych powiększania poprzez zniekształcenie obrazów i zastępując kwiaty DataSet, aby dowiedzieć się klasyfikator obrazu na własny zbiór danych.
Możesz dowiedzieć się więcej o TensorFlow na tensorflow.org i patrz dokumentacja API TF-Hub jest dostępny w tensorflow.org/hub . Znajdź dostępne moduły TensorFlow Hub w tfhub.dev tym bardziej fabularnych obraz modułów wektorowych i modułów osadzania tekstu.
Sprawdź również Machine Learning kurs , który jest Google w szybkim tempie, praktyczne wprowadzenie do uczenia maszynowego.