Transfer stylu artystycznego za pomocą TensorFlow Lite

Jednym z najbardziej ekscytujących wydarzeń w głębokiej nauki wyjdzie niedawna jest artystyczną transferu stylu , lub zdolność do tworzenia nowego obrazu, znany jako pastisz , opartą na dwóch obrazów wejściowych: jeden reprezentujący styl artystyczny i jeden reprezentujący treści.

Przykład przeniesienia stylu

Korzystając z tej techniki, możemy tworzyć piękne, nowe dzieła sztuki w różnych stylach.

Przykład przeniesienia stylu

Jeśli jesteś nowy w TensorFlow Lite i pracujesz z systemem Android, zalecamy zapoznanie się z poniższymi przykładowymi aplikacjami, które mogą pomóc w rozpoczęciu pracy.

Jeśli używasz platformie innej niż Android lub iOS, czy jesteś już zaznajomiony z TensorFlow Lite API , można wykonać ten tutorial, aby dowiedzieć się, jak zastosować przelew styl na dowolnej pary treści i stylu obrazu z wstępnie przeszkolony TensorFlow Lite Model. Możesz użyć modelu, aby dodać transfer stylu do własnych aplikacji mobilnych.

Model jest otwarta pozyskiwane na GitHub . Możesz ponownie nauczyć model z różnymi parametrami (np. zwiększyć wagę warstw zawartości, aby obraz wyjściowy wyglądał bardziej jak obraz zawartości).

Zrozum architekturę modelu

Architektura modelu

Ten model transferu stylu artystycznego składa się z dwóch podmodeli:

  1. Styl Prediciton Model A MobilenetV2 oparte na sieci neuronowej, która pobiera styl wejście obrazu do 100-wymiarowego wektora styl wąskiego gardła.
  2. Styl Transform Model: sieci neuronowe, które ma zastosowanie wektor styl wąskiego gardła do zawartości obrazu i tworzy stylizowany wizerunek.

Jeśli Twoja aplikacja musi obsługiwać tylko stały zestaw obrazów stylów, możesz wcześniej obliczyć ich wektory wąskiego gardła stylu i wykluczyć model przewidywania stylu z pliku binarnego aplikacji.


Importuj zależności.

import tensorflow as tf
import IPython.display as display

import matplotlib.pyplot as plt
import matplotlib as mpl
mpl.rcParams['figure.figsize'] = (12,12)
mpl.rcParams['axes.grid'] = False

import numpy as np
import time
import functools

Pobierz obrazy zawartości i stylu oraz przeszkolone modele TensorFlow Lite.

content_path = tf.keras.utils.get_file('belfry.jpg','')
style_path = tf.keras.utils.get_file('style23.jpg','')

style_predict_path = tf.keras.utils.get_file('style_predict.tflite', '')
style_transform_path = tf.keras.utils.get_file('style_transform.tflite', '')
Wstępnie przetworzyć dane wejściowe

  • Obraz zawartości i obraz stylu muszą być obrazami RGB z wartościami pikseli będącymi liczbami float32 pomiędzy [0..1].
  • Rozmiar obrazu stylu musi wynosić (1, 256, 256, 3). Centralnie przycinamy obraz i zmieniamy jego rozmiar.
  • Obraz treści musi być (1, 384, 384, 3). Centralnie przycinamy obraz i zmieniamy jego rozmiar.
# Function to load an image from a file, and add a batch dimension.
def load_img(path_to_img):
  img =
  img =, channels=3)
  img = tf.image.convert_image_dtype(img, tf.float32)
  img = img[tf.newaxis, :]

  return img

# Function to pre-process by resizing an central cropping it.
def preprocess_image(image, target_dim):
  # Resize the image so that the shorter dimension becomes 256px.
  shape = tf.cast(tf.shape(image)[1:-1], tf.float32)
  short_dim = min(shape)
  scale = target_dim / short_dim
  new_shape = tf.cast(shape * scale, tf.int32)
  image = tf.image.resize(image, new_shape)

  # Central crop the image.
  image = tf.image.resize_with_crop_or_pad(image, target_dim, target_dim)

  return image

# Load the input images.
content_image = load_img(content_path)
style_image = load_img(style_path)

# Preprocess the input images.
preprocessed_content_image = preprocess_image(content_image, 384)
preprocessed_style_image = preprocess_image(style_image, 256)

print('Style Image Shape:', preprocessed_style_image.shape)
print('Content Image Shape:', preprocessed_content_image.shape)
Style Image Shape: (1, 256, 256, 3)
Content Image Shape: (1, 384, 384, 3)

Wizualizuj dane wejściowe

def imshow(image, title=None):
  if len(image.shape) > 3:
    image = tf.squeeze(image, axis=0)

  if title:

plt.subplot(1, 2, 1)
imshow(preprocessed_content_image, 'Content Image')

plt.subplot(1, 2, 2)
imshow(preprocessed_style_image, 'Style Image')


Uruchom transfer stylu za pomocą TensorFlow Lite

Przewidywanie stylu

# Function to run style prediction on preprocessed style image.
def run_style_predict(preprocessed_style_image):
  # Load the model.
  interpreter = tf.lite.Interpreter(model_path=style_predict_path)

  # Set model input.
  input_details = interpreter.get_input_details()
  interpreter.set_tensor(input_details[0]["index"], preprocessed_style_image)

  # Calculate style bottleneck.
  style_bottleneck = interpreter.tensor(

  return style_bottleneck

# Calculate style bottleneck for the preprocessed style image.
style_bottleneck = run_style_predict(preprocessed_style_image)
print('Style Bottleneck Shape:', style_bottleneck.shape)
Style Bottleneck Shape: (1, 1, 1, 100)

Transformacja stylu

# Run style transform on preprocessed style image
def run_style_transform(style_bottleneck, preprocessed_content_image):
  # Load the model.
  interpreter = tf.lite.Interpreter(model_path=style_transform_path)

  # Set model input.
  input_details = interpreter.get_input_details()

  # Set model inputs.
  interpreter.set_tensor(input_details[0]["index"], preprocessed_content_image)
  interpreter.set_tensor(input_details[1]["index"], style_bottleneck)

  # Transform content image.
  stylized_image = interpreter.tensor(

  return stylized_image

# Stylize the content image using the style bottleneck.
stylized_image = run_style_transform(style_bottleneck, preprocessed_content_image)

# Visualize the output.
imshow(stylized_image, 'Stylized Image')


Mieszanie stylów

Możemy połączyć styl obrazu zawartości ze stylizowanymi danymi wyjściowymi, co z kolei sprawi, że wynik będzie bardziej przypominał obraz zawartości.

# Calculate style bottleneck of the content image.
style_bottleneck_content = run_style_predict(
    preprocess_image(content_image, 256)
# Define content blending ratio between [0..1].
# 0.0: 0% style extracts from content image.
# 1.0: 100% style extracted from content image.
content_blending_ratio = 0.5

# Blend the style bottleneck of style image and content image
style_bottleneck_blended = content_blending_ratio * style_bottleneck_content \
                           + (1 - content_blending_ratio) * style_bottleneck

# Stylize the content image using the style bottleneck.
stylized_image_blended = run_style_transform(style_bottleneck_blended,

# Visualize the output.
imshow(stylized_image_blended, 'Blended Stylized Image')


Testy wydajności

Numery testów wydajności są generowane za pomocą narzędzia opisanego tutaj .

Nazwa modelu Rozmiar modelu Urządzenie NNAPI procesor GPU
Model przewidywania stylu (int8) 2,8 Mb Piksel 3 (Android 10) 142ms 14ms
Piksel 4 (Android 10) 5,2 ms 6,7 ms
iPhone XS (iOS 12.4.1) 10,7 ms
Model transformacji stylu (int8) 0,2 Mb Piksel 3 (Android 10) 540ms
Piksel 4 (Android 10) 405 ms
iPhone XS (iOS 12.4.1) 251ms
Model przewidywania stylu (float16) 4,7 Mb Piksel 3 (Android 10) 86ms 28ms 9,1 ms
Piksel 4 (Android 10) 32ms 12ms 10ms
Model przeniesienia stylu (float16) 0,4 Mb Piksel 3 (Android 10) 1095ms 545ms 42ms
Piksel 4 (Android 10) 603ms 377ms 42ms

* 4 wątki użyte.
** 2 wątki na iPhonie zapewniają najlepszą wydajność.