Обучайте и обслуживайте модель TensorFlow с помощью TensorFlow Serving

Это руководство обучает модели нейронной сети для классификации изображений одежды, как кроссовки и рубашки , сохраняет обученную модель, а затем служит его TensorFlow сервировки . Основное внимание уделяется TensorFlow сервировки, а не моделирование и обучения в TensorFlow, поэтому для полного примера , который фокусируется на моделирование и обучение см примера базовой классификации .

Это руководство использует tf.keras , высокоуровневый API для создания и железнодорожных моделей в TensorFlow.

import sys

# Confirm that we're using Python 3
assert sys.version_info.major == 3, 'Oops, not running Python 3. Use Runtime > Change runtime type'
# TensorFlow and tf.keras
print("Installing dependencies for Colab environment")
!pip install -Uq grpcio==1.26.0

import tensorflow as tf
from tensorflow import keras

# Helper libraries
import numpy as np
import matplotlib.pyplot as plt
import os
import subprocess

print('TensorFlow version: {}'.format(tf.__version__))

Создайте свою модель

Импорт набора данных Fashion MNIST

Это руководство использует моды MNIST набор данных , который содержит 70000 черно - белых изображений в 10 категориях. На изображениях показаны отдельные предметы одежды с низким разрешением (28 на 28 пикселей), как показано здесь:

Модный спрайт MNIST
Рисунок 1. Образцы Мода-MNIST (по Zalando, MIT License).

Мода MNIST предназначена как капля замены для классического MNIST набора данных, часто используются как «Hello, World» программ машинного обучения для компьютерного зрения. Вы можете получить доступ к Fashion MNIST напрямую из TensorFlow, просто импортируйте и загрузите данные.

fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

# scale the values to 0.0 to 1.0
= train_images / 255.0
= test_images / 255.0

# reshape for feeding into the model
= train_images.reshape(train_images.shape[0], 28, 28, 1)
= test_images.reshape(test_images.shape[0], 28, 28, 1)

= ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

print('\ntrain_images.shape: {}, of {}'.format(train_images.shape, train_images.dtype))
print('test_images.shape: {}, of {}'.format(test_images.shape, test_images.dtype))
train_images.shape: (60000, 28, 28, 1), of float64
test_images.shape: (10000, 28, 28, 1), of float64

Обучите и оцените свою модель

Давайте воспользуемся самой простой CNN, так как мы не сосредоточены на части моделирования.

model = keras.Sequential([
.layers.Conv2D(input_shape=(28,28,1), filters=8, kernel_size=3,
=2, activation='relu', name='Conv1'),
.layers.Dense(10, name='Dense')

= False
= 5

.fit(train_images, train_labels, epochs=epochs)

, test_acc = model.evaluate(test_images, test_labels)
print('\nTest accuracy: {}'.format(test_acc))
Model: "sequential"
Layer (type)                 Output Shape              Param #   
Conv1 (Conv2D)               (None, 13, 13, 8)         80        
flatten (Flatten)            (None, 1352)              0         
Dense (Dense)                (None, 10)                13530     
Total params: 13,610
Trainable params: 13,610
Non-trainable params: 0
Epoch 1/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.7204 - sparse_categorical_accuracy: 0.7549
Epoch 2/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.3997 - sparse_categorical_accuracy: 0.8611
Epoch 3/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.3580 - sparse_categorical_accuracy: 0.8754
Epoch 4/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.3399 - sparse_categorical_accuracy: 0.8780
Epoch 5/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.3232 - sparse_categorical_accuracy: 0.8849
313/313 [==============================] - 0s 1ms/step - loss: 0.3586 - sparse_categorical_accuracy: 0.8738

Test accuracy: 0.8737999796867371

Сохраните вашу модель

Для того, чтобы загрузить нашу обученную модель в TensorFlow сервировки сначала нужно сохранить его в SavedModel формате. Это создаст файл protobuf в четко определенной иерархии каталогов и будет включать номер версии. TensorFlow сервировка позволяет выбрать , какую версию модели, или «servable» мы хотим использовать , когда мы делаем запросы логического вывода. Каждая версия будет экспортирована в другой подкаталог по заданному пути.

# Fetch the Keras session and save the model
# The signature definition is defined by the input and output tensors,
# and stored with the default serving key
import tempfile

= tempfile.gettempdir()
= 1
= os.path.join(MODEL_DIR, str(version))
print('export_path = {}\n'.format(export_path))


print('\nSaved model:')
!ls -l {export_path}
export_path = /tmp/1
2021-12-04 10:29:53.392905: W tensorflow/python/util/util.cc:348] Sets are not currently considered sequences, but this may change in the future, so consider avoiding using them.
INFO:tensorflow:Assets written to: /tmp/1/assets

Saved model:
total 88
drwxr-xr-x 2 kbuilder kbuilder  4096 Dec  4 10:29 assets
-rw-rw-r-- 1 kbuilder kbuilder 78055 Dec  4 10:29 saved_model.pb
drwxr-xr-x 2 kbuilder kbuilder  4096 Dec  4 10:29 variables

Изучите сохраненную модель

Мы будем использовать утилиту командной строки saved_model_cli посмотреть на MetaGraphDefs (модели) и SignatureDefs (методы , которые вы можете позвонить) в нашей SavedModel. См дискуссию о SavedModel CLI в руководстве TensorFlow.

saved_model_cli show --dir {export_path} --all
MetaGraphDef with tag-set: 'serve' contains the following SignatureDefs:

  The given SavedModel SignatureDef contains the following input(s):
  The given SavedModel SignatureDef contains the following output(s):
    outputs['__saved_model_init_op'] tensor_info:
        dtype: DT_INVALID
        shape: unknown_rank
        name: NoOp
  Method name is: 

  The given SavedModel SignatureDef contains the following input(s):
    inputs['Conv1_input'] tensor_info:
        dtype: DT_FLOAT
        shape: (-1, 28, 28, 1)
        name: serving_default_Conv1_input:0
  The given SavedModel SignatureDef contains the following output(s):
    outputs['Dense'] tensor_info:
        dtype: DT_FLOAT
        shape: (-1, 10)
        name: StatefulPartitionedCall:0
  Method name is: tensorflow/serving/predict

Defined Functions:
  Function Name: '__call__'
    Option #1
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')
        Argument #2
          DType: bool
          Value: False
        Argument #3
          DType: NoneType
          Value: None
    Option #2
      Callable with:
        Argument #1
          inputs: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='inputs')
        Argument #2
          DType: bool
          Value: False
        Argument #3
          DType: NoneType
          Value: None
    Option #3
      Callable with:
        Argument #1
          inputs: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='inputs')
        Argument #2
          DType: bool
          Value: True
        Argument #3
          DType: NoneType
          Value: None
    Option #4
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')
        Argument #2
          DType: bool
          Value: True
        Argument #3
          DType: NoneType
          Value: None

  Function Name: '_default_save_signature'
    Option #1
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')

  Function Name: 'call_and_return_all_conditional_losses'
    Option #1
      Callable with:
        Argument #1
          inputs: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='inputs')
        Argument #2
          DType: bool
          Value: False
        Argument #3
          DType: NoneType
          Value: None
    Option #2
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')
        Argument #2
          DType: bool
          Value: True
        Argument #3
          DType: NoneType
          Value: None
    Option #3
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')
        Argument #2
          DType: bool
          Value: False
        Argument #3
          DType: NoneType
          Value: None
    Option #4
      Callable with:
        Argument #1
          inputs: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='inputs')
        Argument #2
          DType: bool
          Value: True
        Argument #3
          DType: NoneType
          Value: None

Это многое говорит нам о нашей модели! В этом случае мы только что обучили нашу модель, поэтому мы уже знаем входные и выходные данные, но если бы мы этого не сделали, это была бы важная информация. Это не говорит нам всего, например, тот факт, что это данные изображения в градациях серого, но это отличное начало.

Обслуживайте свою модель с помощью TensorFlow Serving

Добавьте URI распространения TensorFlow Serving в качестве источника пакета:

Мы готовимся к установке TensorFlow Обслуживание с помощью Aptitude , поскольку это Colab работает в среде Debian. Мы добавим tensorflow-model-server пакет в список пакетов , которые Склонность знает. Обратите внимание, что мы работаем как root.

import sys
# We need sudo prefix if not on a Google Colab.
if 'google.colab' not in sys.modules:
= 'sudo'
= ''
# This is the same as you would do from your command line, but without the [arch=amd64], and no sudo
# You would instead do:
# echo "deb [arch=amd64] http://storage.googleapis.com/tensorflow-serving-apt stable tensorflow-model-server tensorflow-model-server-universal" | sudo tee /etc/apt/sources.list.d/tensorflow-serving.list && \
# curl https://storage.googleapis.com/tensorflow-serving-apt/tensorflow-serving.release.pub.gpg | sudo apt-key add -

!echo "deb http://storage.googleapis.com/tensorflow-serving-apt stable tensorflow-model-server tensorflow-model-server-universal" | {SUDO_IF_NEEDED} tee /etc/apt/sources.list.d/tensorflow-serving.list && \
curl https
://storage.googleapis.com/tensorflow-serving-apt/tensorflow-serving.release.pub.gpg | {SUDO_IF_NEEDED} apt-key add -
!{SUDO_IF_NEEDED} apt update
Установите обслуживание TensorFlow

Это все, что вам нужно - одна командная строка!

{SUDO_IF_NEEDED} apt-get install tensorflow-model-server
Запустите TensorFlow Serving

Здесь мы запускаем TensorFlow Serving и загружаем нашу модель. После того, как он загрузится, мы можем начать делать запросы на вывод с помощью REST. Есть несколько важных параметров:

  • rest_api_port : Порт , который вы будете использовать для REST запросов.
  • model_name : Вы будете использовать это в URL в REST запросов. Это может быть что угодно.
  • model_base_path : Это путь к директории , в которой вы сохранили свою модель.
os.environ["MODEL_DIR"] = MODEL_DIR
nohup tensorflow_model_server \
  --rest_api_port=8501 \
  --model_name=fashion_model \
  --model_base_path="${MODEL_DIR}" >server.log 2>&1
tail server.log

Сделайте запрос к вашей модели в TensorFlow Serving

Во-первых, давайте взглянем на случайный пример из наших тестовых данных.

def show(idx, title):
.title('\n\n{}'.format(title), fontdict={'size': 16})

import random
= random.randint(0,len(test_images)-1)
(rando, 'An Example Image: {}'.format(class_names[test_labels[rando]]))


Хорошо, это выглядит интересно. Насколько трудно вам это признать? Теперь давайте создадим объект JSON для пакета из трех запросов на вывод и посмотрим, насколько хорошо наша модель распознает вещи:

import json
= json.dumps({"signature_name": "serving_default", "instances": test_images[0:3].tolist()})
print('Data: {} ... {}'.format(data[:50], data[len(data)-52:]))
Data: {"signature_name": "serving_default", "instances": ...  [0.0], [0.0], [0.0], [0.0], [0.0], [0.0], [0.0]]]]}

Делайте REST-запросы

Новейшая версия сервиса

Мы отправим запрос прогнозирования в виде POST на конечную точку REST нашего сервера и передадим ему три примера. Мы попросим наш сервер предоставить нам последнюю версию нашего сервиса, не указывая конкретную версию.

# docs_infra: no_execute
!pip install -q requests

import requests
= {"content-type": "application/json"}
= requests.post('http://localhost:8501/v1/models/fashion_model:predict', data=data, headers=headers)
= json.loads(json_response.text)['predictions']

(0, 'The model thought this was a {} (class {}), and it was actually a {} (class {})'.format(
[np.argmax(predictions[0])], np.argmax(predictions[0]), class_names[test_labels[0]], test_labels[0]))

Конкретная версия сервиса

Теперь давайте укажем конкретную версию нашего servable. Поскольку у нас есть только один, давайте выберем версию 1. Мы также рассмотрим все три результата.

# docs_infra: no_execute
= {"content-type": "application/json"}
= requests.post('http://localhost:8501/v1/models/fashion_model/versions/1:predict', data=data, headers=headers)
= json.loads(json_response.text)['predictions']

for i in range(0,3):
(i, 'The model thought this was a {} (class {}), and it was actually a {} (class {})'.format(
[np.argmax(predictions[i])], np.argmax(predictions[i]), class_names[test_labels[i]], test_labels[i]))