مدل TensorFlow را با سرویس TensorFlow آموزش دهید و خدمت کنید

این راهنما آموزش یک مدل شبکه عصبی برای طبقه بندی تصاویر از لباس، مانند کفش ورزشی و پیراهن ، موجب صرفه جویی در مدل آموزش دیده، و سپس آن را در خدمت با TensorFlow خدمت . تمرکز بر TensorFlow خدمت، به جای مدل سازی و آموزش در TensorFlow، بنابراین برای یک مثال کامل که در مدل سازی و آموزش دیدن، تمرکز دارد به عنوان مثال طبقه بندی عمومی .

این راهنما با استفاده از tf.keras ، یک API سطح بالا به مدل های ساخت و قطار در TensorFlow.

import sys

# Confirm that we're using Python 3
assert sys.version_info.major == 3, 'Oops, not running Python 3. Use Runtime > Change runtime type'
# TensorFlow and tf.keras
print("Installing dependencies for Colab environment")
!pip install -Uq grpcio==1.26.0

import tensorflow as tf
from tensorflow import keras

# Helper libraries
import numpy as np
import matplotlib.pyplot as plt
import os
import subprocess

print('TensorFlow version: {}'.format(tf.__version__))

مدل خود را ایجاد کنید

مجموعه داده Fashion MNIST را وارد کنید

این راهنما با استفاده از مد MNIST مجموعه داده که شامل 70000 تصاویر سیاه و سفید در 10 دسته بندی. تصاویر تک تک لباس ها را با وضوح پایین (28 در 28 پیکسل) نشان می دهند، همانطور که در اینجا مشاهده می کنید:

جن MNIST مد
شکل 1. نمونه مد MNIST (توسط Zalando، مجوز MIT).

مد MNIST به عنوان یک قطره در جایگزینی برای کلاسیک در نظر گرفته شده MNIST مجموعه داده-اغلب به عنوان "سلام جهان" از برنامه های یادگیری ماشین برای بینایی کامپیوتر استفاده می شود. می‌توانید مستقیماً از TensorFlow به Fashion MNIST دسترسی پیدا کنید، فقط داده‌ها را وارد کرده و بارگذاری کنید.

fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

# scale the values to 0.0 to 1.0
= train_images / 255.0
= test_images / 255.0

# reshape for feeding into the model
= train_images.reshape(train_images.shape[0], 28, 28, 1)
= test_images.reshape(test_images.shape[0], 28, 28, 1)

= ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

print('\ntrain_images.shape: {}, of {}'.format(train_images.shape, train_images.dtype))
print('test_images.shape: {}, of {}'.format(test_images.shape, test_images.dtype))
train_images.shape: (60000, 28, 28, 1), of float64
test_images.shape: (10000, 28, 28, 1), of float64

مدل خود را آموزش دهید و ارزیابی کنید

بیایید از ساده ترین CNN ممکن استفاده کنیم، زیرا ما روی بخش مدل سازی تمرکز نداریم.

model = keras.Sequential([
.layers.Conv2D(input_shape=(28,28,1), filters=8, kernel_size=3,
=2, activation='relu', name='Conv1'),
.layers.Dense(10, name='Dense')

= False
= 5

.fit(train_images, train_labels, epochs=epochs)

, test_acc = model.evaluate(test_images, test_labels)
print('\nTest accuracy: {}'.format(test_acc))
Model: "sequential"
Layer (type)                 Output Shape              Param #   
Conv1 (Conv2D)               (None, 13, 13, 8)         80        
flatten (Flatten)            (None, 1352)              0         
Dense (Dense)                (None, 10)                13530     
Total params: 13,610
Trainable params: 13,610
Non-trainable params: 0
Epoch 1/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.7204 - sparse_categorical_accuracy: 0.7549
Epoch 2/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.3997 - sparse_categorical_accuracy: 0.8611
Epoch 3/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.3580 - sparse_categorical_accuracy: 0.8754
Epoch 4/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.3399 - sparse_categorical_accuracy: 0.8780
Epoch 5/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.3232 - sparse_categorical_accuracy: 0.8849
313/313 [==============================] - 0s 1ms/step - loss: 0.3586 - sparse_categorical_accuracy: 0.8738

Test accuracy: 0.8737999796867371

مدل خود را ذخیره کنید

برای بارگذاری مدل آموزش دیده ما به TensorFlow خدمت ما برای اولین بار نیاز به آن را ذخیره کنید در SavedModel فرمت. این یک فایل protobuf در یک سلسله مراتب دایرکتوری کاملاً تعریف شده ایجاد می کند و شامل یک شماره نسخه می شود. TensorFlow تعمیر و نگهداری ما اجازه می دهد تا انتخاب کنید که کدام نسخه از یک مدل، و یا "servable" ما می خواهیم به استفاده از زمانی که ما درخواست استنتاج است. هر نسخه در مسیر داده شده به یک زیر شاخه متفاوت صادر می شود.

# Fetch the Keras session and save the model
# The signature definition is defined by the input and output tensors,
# and stored with the default serving key
import tempfile

= tempfile.gettempdir()
= 1
= os.path.join(MODEL_DIR, str(version))
print('export_path = {}\n'.format(export_path))


print('\nSaved model:')
!ls -l {export_path}
export_path = /tmp/1
Saved model:
total 88
drwxr-xr-x 2 kbuilder kbuilder  4096 Dec  4 10:29 assets
-rw-rw-r-- 1 kbuilder kbuilder 78055 Dec  4 10:29 saved_model.pb
drwxr-xr-x 2 kbuilder kbuilder  4096 Dec  4 10:29 variables

مدل ذخیره شده خود را بررسی کنید

ما دستور ابزار خط را با استفاده از saved_model_cli به در نگاه MetaGraphDefs (مدل) و SignatureDefs (روش شما می توانید پاسخ) در SavedModel ما است. مشاهده این بحث از SavedModel CLI در راهنمای TensorFlow.

saved_model_cli show --dir {export_path} --all
MetaGraphDef with tag-set: 'serve' contains the following SignatureDefs:

  The given SavedModel SignatureDef contains the following input(s):
  The given SavedModel SignatureDef contains the following output(s):
    outputs['__saved_model_init_op'] tensor_info:
        dtype: DT_INVALID
        shape: unknown_rank
        name: NoOp
  Method name is: 

  The given SavedModel SignatureDef contains the following input(s):
    inputs['Conv1_input'] tensor_info:
        dtype: DT_FLOAT
        shape: (-1, 28, 28, 1)
        name: serving_default_Conv1_input:0
  The given SavedModel SignatureDef contains the following output(s):
    outputs['Dense'] tensor_info:
        dtype: DT_FLOAT
        shape: (-1, 10)
        name: StatefulPartitionedCall:0
  Method name is: tensorflow/serving/predict

Defined Functions:
  Function Name: '__call__'
    Option #1
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')
        Argument #2
          DType: bool
          Value: False
        Argument #3
          DType: NoneType
          Value: None
    Option #2
      Callable with:
        Argument #1
          inputs: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='inputs')
        Argument #2
          DType: bool
          Value: False
        Argument #3
          DType: NoneType
          Value: None
    Option #3
      Callable with:
        Argument #1
          inputs: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='inputs')
        Argument #2
          DType: bool
          Value: True
        Argument #3
          DType: NoneType
          Value: None
    Option #4
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')
        Argument #2
          DType: bool
          Value: True
        Argument #3
          DType: NoneType
          Value: None

  Function Name: '_default_save_signature'
    Option #1
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')

  Function Name: 'call_and_return_all_conditional_losses'
    Option #1
      Callable with:
        Argument #1
          inputs: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='inputs')
        Argument #2
          DType: bool
          Value: False
        Argument #3
          DType: NoneType
          Value: None
    Option #2
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')
        Argument #2
          DType: bool
          Value: True
        Argument #3
          DType: NoneType
          Value: None
    Option #3
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')
        Argument #2
          DType: bool
          Value: False
        Argument #3
          DType: NoneType
          Value: None
    Option #4
      Callable with:
        Argument #1
          inputs: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='inputs')
        Argument #2
          DType: bool
          Value: True
        Argument #3
          DType: NoneType
          Value: None

این به ما چیزهای زیادی در مورد مدل ما می گوید! در این مورد ما فقط مدل خود را آموزش دادیم، بنابراین ورودی ها و خروجی ها را از قبل می دانیم، اما اگر این کار را نمی کردیم، اطلاعات مهمی بود. همه چیز را به ما نمی گوید، مثلاً این که داده های تصویر در مقیاس خاکستری هستند، اما شروعی عالی است.

مدل خود را با سرویس TensorFlow سرو کنید

URI توزیع سرویس TensorFlow را به عنوان منبع بسته اضافه کنید:

ما در حال آماده سازی برای نصب TensorFlow خدمت با استفاده از استعداد از آنجایی که این COLAB اجرا می شود در یک محیط دبیان. ما اضافه کنید tensorflow-model-server بسته به لیست بسته هایی که استعداد می داند در مورد. توجه داشته باشید که ما در حال اجرا به عنوان root هستیم.

import sys
# We need sudo prefix if not on a Google Colab.
if 'google.colab' not in sys.modules:
= 'sudo'
= ''
# This is the same as you would do from your command line, but without the [arch=amd64], and no sudo
# You would instead do:
# echo "deb [arch=amd64] http://storage.googleapis.com/tensorflow-serving-apt stable tensorflow-model-server tensorflow-model-server-universal" | sudo tee /etc/apt/sources.list.d/tensorflow-serving.list && \
# curl https://storage.googleapis.com/tensorflow-serving-apt/tensorflow-serving.release.pub.gpg | sudo apt-key add -

!echo "deb http://storage.googleapis.com/tensorflow-serving-apt stable tensorflow-model-server tensorflow-model-server-universal" | {SUDO_IF_NEEDED} tee /etc/apt/sources.list.d/tensorflow-serving.list && \
curl https
://storage.googleapis.com/tensorflow-serving-apt/tensorflow-serving.release.pub.gpg | {SUDO_IF_NEEDED} apt-key add -
!{SUDO_IF_NEEDED} apt update
سرویس TensorFlow را نصب کنید

این تمام چیزی است که نیاز دارید - یک خط فرمان!

{SUDO_IF_NEEDED} apt-get install tensorflow-model-server
اجرای TensorFlow Serving را شروع کنید

اینجاست که ما شروع به اجرای TensorFlow Serving می کنیم و مدل خود را بارگذاری می کنیم. پس از بارگیری، می‌توانیم درخواست‌های استنتاج را با استفاده از REST شروع کنیم. چند پارامتر مهم وجود دارد:

  • rest_api_port : پورت است که شما برای درخواست REST استفاده کنید.
  • model_name : شما از این در URL درخواست REST استفاده کنید. می تواند هر چیزی باشد.
  • model_base_path : این مسیر به دایرکتوری که در آن شما مدل خود را ذخیره کرده اید است.
os.environ["MODEL_DIR"] = MODEL_DIR
nohup tensorflow_model_server \
  --rest_api_port=8501 \
  --model_name=fashion_model \
  --model_base_path="${MODEL_DIR}" >server.log 2>&1
tail server.log

از مدل خود در سرویس TensorFlow درخواست دهید

ابتدا، اجازه دهید نگاهی به یک مثال تصادفی از داده های آزمایشی خود بیاندازیم.

def show(idx, title):
.title('\n\n{}'.format(title), fontdict={'size': 16})

import random
= random.randint(0,len(test_images)-1)
(rando, 'An Example Image: {}'.format(class_names[test_labels[rando]]))


خوب، به نظر جالب می رسد. تشخیص آن برای شما چقدر سخت است؟ حالا بیایید شی JSON را برای دسته ای از سه درخواست استنتاج ایجاد کنیم و ببینیم مدل ما چقدر چیزها را تشخیص می دهد:

import json
= json.dumps({"signature_name": "serving_default", "instances": test_images[0:3].tolist()})
print('Data: {} ... {}'.format(data[:50], data[len(data)-52:]))
Data: {"signature_name": "serving_default", "instances": ...  [0.0], [0.0], [0.0], [0.0], [0.0], [0.0], [0.0]]]]}

درخواست های REST را انجام دهید

جدیدترین نسخه سرویس پذیر

ما یک درخواست پیش‌بینی را به‌عنوان یک POST به نقطه پایانی REST سرور خود ارسال می‌کنیم و سه نمونه آن را ارسال می‌کنیم. ما از سرور خود می خواهیم که آخرین نسخه قابل سرویس دهی خود را با مشخص نکردن نسخه خاصی به ما بدهد.

# docs_infra: no_execute
!pip install -q requests

import requests
= {"content-type": "application/json"}
= requests.post('http://localhost:8501/v1/models/fashion_model:predict', data=data, headers=headers)
= json.loads(json_response.text)['predictions']

(0, 'The model thought this was a {} (class {}), and it was actually a {} (class {})'.format(
[np.argmax(predictions[0])], np.argmax(predictions[0]), class_names[test_labels[0]], test_labels[0]))

یک نسخه خاص از سرویس پذیر

حال بیایید یک نسخه خاص از سرویس پذیر خود را مشخص کنیم. از آنجایی که فقط یک مورد داریم، بیایید نسخه 1 را انتخاب کنیم. همچنین به هر سه نتیجه نگاه خواهیم کرد.

# docs_infra: no_execute
= {"content-type": "application/json"}
= requests.post('http://localhost:8501/v1/models/fashion_model/versions/1:predict', data=data, headers=headers)
= json.loads(json_response.text)['predictions']

for i in range(0,3):
(i, 'The model thought this was a {} (class {}), and it was actually a {} (class {})'.format(
[np.argmax(predictions[i])], np.argmax(predictions[i]), class_names[test_labels[i]], test_labels[i]))