ฝึกและให้บริการโมเดล TensorFlow ด้วย TensorFlow Serving

คู่มือนี้จะทำให้รูปแบบเครือข่ายประสาทในการจำแนก ภาพของเสื้อผ้าเช่นรองเท้าผ้าใบและเสื้อ ประหยัดรูปแบบการฝึกอบรมและให้บริการแล้วกับ TensorFlow การแสดง ให้ความสำคัญกับ TensorFlow ให้บริการมากกว่าการสร้างแบบจำลองและการฝึกอบรมใน TensorFlow ดังนั้นสำหรับตัวอย่างที่สมบูรณ์ซึ่งมุ่งเน้นไปที่การสร้างแบบจำลองและการฝึกอบรมดู ตัวอย่างพื้นฐานการจัดหมวดหมู่

คู่มือนี้ใช้ tf.keras , ระดับสูง API เพื่อสร้างรถไฟและรูปแบบใน TensorFlow

import sys

# Confirm that we're using Python 3
assert sys.version_info.major == 3, 'Oops, not running Python 3. Use Runtime > Change runtime type'
# TensorFlow and tf.keras
print("Installing dependencies for Colab environment")
!pip install -Uq grpcio==1.26.0

import tensorflow as tf
from tensorflow import keras

# Helper libraries
import numpy as np
import matplotlib.pyplot as plt
import os
import subprocess

print('TensorFlow version: {}'.format(tf.__version__))


นำเข้าชุดข้อมูล Fashion MNIST

คู่มือนี้ใช้ แฟชั่น MNIST ชุดข้อมูลที่มี 70,000 ภาพสีเทาใน 10 หมวดหมู่ รูปภาพแสดงบทความเกี่ยวกับเสื้อผ้าแต่ละชิ้นที่มีความละเอียดต่ำ (28 x 28 พิกเซล) ดังที่แสดงไว้ที่นี่:

แฟชั่น MNIST สไปรท์
รูปที่ 1 ตัวอย่างแฟชั่น MNIST (โดย Zalando, MIT ใบอนุญาต)

แฟชั่น MNIST มีวัตถุประสงค์เพื่อเป็นดรอปแทนสำหรับคลาสสิก MNIST ชุดข้อมูลที่มักจะใช้เป็น "สวัสดีโลก" ของโปรแกรมการเรียนรู้สำหรับเครื่องคอมพิวเตอร์วิสัยทัศน์ คุณสามารถเข้าถึง Fashion MNIST ได้โดยตรงจาก TensorFlow เพียงนำเข้าและโหลดข้อมูล

fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

# scale the values to 0.0 to 1.0
= train_images / 255.0
= test_images / 255.0

# reshape for feeding into the model
= train_images.reshape(train_images.shape[0], 28, 28, 1)
= test_images.reshape(test_images.shape[0], 28, 28, 1)

= ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

print('\ntrain_images.shape: {}, of {}'.format(train_images.shape, train_images.dtype))
print('test_images.shape: {}, of {}'.format(test_images.shape, test_images.dtype))
train_images.shape: (60000, 28, 28, 1), of float64
test_images.shape: (10000, 28, 28, 1), of float64


ลองใช้ CNN ที่ง่ายที่สุด เนื่องจากเราไม่ได้เน้นที่ส่วนการสร้างแบบจำลอง

model = keras.Sequential([
.layers.Conv2D(input_shape=(28,28,1), filters=8, kernel_size=3,
=2, activation='relu', name='Conv1'),
.layers.Dense(10, name='Dense')

= False
= 5

.fit(train_images, train_labels, epochs=epochs)

, test_acc = model.evaluate(test_images, test_labels)
print('\nTest accuracy: {}'.format(test_acc))
Model: "sequential"
Layer (type)                 Output Shape              Param #   
Conv1 (Conv2D)               (None, 13, 13, 8)         80        
flatten (Flatten)            (None, 1352)              0         
Dense (Dense)                (None, 10)                13530     
Total params: 13,610
Trainable params: 13,610
Non-trainable params: 0
Epoch 1/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.7204 - sparse_categorical_accuracy: 0.7549
Epoch 2/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.3997 - sparse_categorical_accuracy: 0.8611
Epoch 3/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.3580 - sparse_categorical_accuracy: 0.8754
Epoch 4/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.3399 - sparse_categorical_accuracy: 0.8780
Epoch 5/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.3232 - sparse_categorical_accuracy: 0.8849
313/313 [==============================] - 0s 1ms/step - loss: 0.3586 - sparse_categorical_accuracy: 0.8738

Test accuracy: 0.8737999796867371


การโหลดรูปแบบการฝึกอบรมของเราในการให้บริการ TensorFlow เราต้องบันทึกไว้ใน SavedModel รูปแบบ สิ่งนี้จะสร้างไฟล์ protobuf ในลำดับชั้นไดเร็กทอรีที่กำหนดไว้อย่างดี และจะรวมหมายเลขเวอร์ชันไว้ด้วย TensorFlow เสิร์ฟ ช่วยให้เราสามารถเลือกรุ่นของรูปแบบหรือ "servable" เราต้องการที่จะใช้เมื่อเราทำการร้องขอการอนุมาน แต่ละเวอร์ชันจะถูกส่งออกไปยังไดเร็กทอรีย่อยอื่นภายใต้เส้นทางที่กำหนด

# Fetch the Keras session and save the model
# The signature definition is defined by the input and output tensors,
# and stored with the default serving key
import tempfile

= tempfile.gettempdir()
= 1
= os.path.join(MODEL_DIR, str(version))
print('export_path = {}\n'.format(export_path))


print('\nSaved model:')
!ls -l {export_path}
export_path = /tmp/1
Saved model:
total 88
drwxr-xr-x 2 kbuilder kbuilder  4096 Dec  4 10:29 assets
-rw-rw-r-- 1 kbuilder kbuilder 78055 Dec  4 10:29 saved_model.pb
drwxr-xr-x 2 kbuilder kbuilder  4096 Dec  4 10:29 variables


เราจะใช้คำสั่งอรรถประโยชน์บรรทัด saved_model_cli จะมองไปที่ MetaGraphDefs (ทุกรุ่น) และ SignatureDefs (วิธีการที่คุณสามารถโทร) ใน SavedModel ของเรา ดู การอภิปรายของ SavedModel CLI นี้ ในคู่มือ TensorFlow

saved_model_cli show --dir {export_path} --all
MetaGraphDef with tag-set: 'serve' contains the following SignatureDefs:

  The given SavedModel SignatureDef contains the following input(s):
  The given SavedModel SignatureDef contains the following output(s):
    outputs['__saved_model_init_op'] tensor_info:
        dtype: DT_INVALID
        shape: unknown_rank
        name: NoOp
  Method name is: 

  The given SavedModel SignatureDef contains the following input(s):
    inputs['Conv1_input'] tensor_info:
        dtype: DT_FLOAT
        shape: (-1, 28, 28, 1)
        name: serving_default_Conv1_input:0
  The given SavedModel SignatureDef contains the following output(s):
    outputs['Dense'] tensor_info:
        dtype: DT_FLOAT
        shape: (-1, 10)
        name: StatefulPartitionedCall:0
  Method name is: tensorflow/serving/predict

Defined Functions:
  Function Name: '__call__'
    Option #1
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')
        Argument #2
          DType: bool
          Value: False
        Argument #3
          DType: NoneType
          Value: None
    Option #2
      Callable with:
        Argument #1
          inputs: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='inputs')
        Argument #2
          DType: bool
          Value: False
        Argument #3
          DType: NoneType
          Value: None
    Option #3
      Callable with:
        Argument #1
          inputs: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='inputs')
        Argument #2
          DType: bool
          Value: True
        Argument #3
          DType: NoneType
          Value: None
    Option #4
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')
        Argument #2
          DType: bool
          Value: True
        Argument #3
          DType: NoneType
          Value: None

  Function Name: '_default_save_signature'
    Option #1
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')

  Function Name: 'call_and_return_all_conditional_losses'
    Option #1
      Callable with:
        Argument #1
          inputs: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='inputs')
        Argument #2
          DType: bool
          Value: False
        Argument #3
          DType: NoneType
          Value: None
    Option #2
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')
        Argument #2
          DType: bool
          Value: True
        Argument #3
          DType: NoneType
          Value: None
    Option #3
      Callable with:
        Argument #1
          Conv1_input: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='Conv1_input')
        Argument #2
          DType: bool
          Value: False
        Argument #3
          DType: NoneType
          Value: None
    Option #4
      Callable with:
        Argument #1
          inputs: TensorSpec(shape=(None, 28, 28, 1), dtype=tf.float32, name='inputs')
        Argument #2
          DType: bool
          Value: True
        Argument #3
          DType: NoneType
          Value: None

ที่บอกเรามากมายเกี่ยวกับรูปแบบของเรา! ในกรณีนี้ เราเพิ่งฝึกโมเดลของเรา เราจึงรู้อินพุตและเอาต์พุตอยู่แล้ว แต่ถ้าเราไม่ทำ ข้อมูลนี้ก็จะเป็นข้อมูลที่สำคัญ มันไม่ได้บอกเราทุกอย่าง เช่น ข้อเท็จจริงที่ว่านี่คือข้อมูลภาพระดับสีเทา แต่เป็นการเริ่มต้นที่ดี

ให้บริการโมเดลของคุณด้วย TensorFlow Serving

เพิ่ม URI การกระจายการให้บริการ TensorFlow เป็นแหล่งที่มาของแพ็คเกจ:

เรากำลังเตรียมการติดตั้ง TensorFlow ให้บริการโดยใช้ ความถนัด ตั้งแต่ Colab นี้จะทำงานในสภาพแวดล้อมที่ Debian เราจะเพิ่ม tensorflow-model-server แพคเกจไปยังรายการของแพคเกจที่ถนัดรู้เกี่ยวกับ โปรดทราบว่าเรากำลังทำงานเป็นรูท

import sys
# We need sudo prefix if not on a Google Colab.
if 'google.colab' not in sys.modules:
= 'sudo'
= ''
# This is the same as you would do from your command line, but without the [arch=amd64], and no sudo
# You would instead do:
# echo "deb [arch=amd64] http://storage.googleapis.com/tensorflow-serving-apt stable tensorflow-model-server tensorflow-model-server-universal" | sudo tee /etc/apt/sources.list.d/tensorflow-serving.list && \
# curl https://storage.googleapis.com/tensorflow-serving-apt/tensorflow-serving.release.pub.gpg | sudo apt-key add -

!echo "deb http://storage.googleapis.com/tensorflow-serving-apt stable tensorflow-model-server tensorflow-model-server-universal" | {SUDO_IF_NEEDED} tee /etc/apt/sources.list.d/tensorflow-serving.list && \
curl https
://storage.googleapis.com/tensorflow-serving-apt/tensorflow-serving.release.pub.gpg | {SUDO_IF_NEEDED} apt-key add -
!{SUDO_IF_NEEDED} apt update
ติดตั้งบริการ TensorFlow

นี่คือทั้งหมดที่คุณต้องการ - หนึ่งบรรทัดคำสั่ง!

{SUDO_IF_NEEDED} apt-get install tensorflow-model-server
เริ่มใช้งาน TensorFlow Serving

นี่คือที่ที่เราเริ่มเรียกใช้ TensorFlow Serving และโหลดแบบจำลองของเรา หลังจากโหลดแล้ว เราสามารถเริ่มส่งคำขออนุมานโดยใช้ REST มีพารามิเตอร์ที่สำคัญบางประการ:

  • rest_api_port : พอร์ตที่คุณจะใช้สำหรับการร้องขอ REST
  • model_name : คุณจะใช้วิธีนี้ใน URL ของการร้องขอส่วนที่เหลือ มันสามารถเป็นอะไรก็ได้
  • model_base_path : นี่คือเส้นทางไปยังไดเรกทอรีที่คุณได้บันทึกรูปแบบของคุณ
os.environ["MODEL_DIR"] = MODEL_DIR
nohup tensorflow_model_server \
  --rest_api_port=8501 \
  --model_name=fashion_model \
  --model_base_path="${MODEL_DIR}" >server.log 2>&1
tail server.log

ส่งคำขอไปยังโมเดลของคุณใน TensorFlow Serving

ขั้นแรก มาดูตัวอย่างแบบสุ่มจากข้อมูลการทดสอบของเรา

def show(idx, title):
.title('\n\n{}'.format(title), fontdict={'size': 16})

import random
= random.randint(0,len(test_images)-1)
(rando, 'An Example Image: {}'.format(class_names[test_labels[rando]]))


โอเค มันดูน่าสนใจ มันยากแค่ไหนสำหรับคุณที่จะรับรู้? ตอนนี้ มาสร้างวัตถุ JSON สำหรับคำขออนุมานสามชุด และดูว่าโมเดลของเรารู้จักสิ่งต่างๆ ได้ดีเพียงใด:

import json
= json.dumps({"signature_name": "serving_default", "instances": test_images[0:3].tolist()})
print('Data: {} ... {}'.format(data[:50], data[len(data)-52:]))
Data: {"signature_name": "serving_default", "instances": ...  [0.0], [0.0], [0.0], [0.0], [0.0], [0.0], [0.0]]]]}

ทำการร้องขอ REST

เวอร์ชั่นใหม่ล่าสุดของ servable

เราจะส่งคำขอที่คาดคะเนเป็น POST ไปยังปลายทาง REST ของเซิร์ฟเวอร์ของเรา และส่งต่อตัวอย่างสามตัวอย่าง เราจะขอให้เซิร์ฟเวอร์ของเราให้เวอร์ชันล่าสุดของเซิร์ฟเวอร์ของเราโดยไม่ระบุเวอร์ชันเฉพาะ

# docs_infra: no_execute
!pip install -q requests

import requests
= {"content-type": "application/json"}
= requests.post('http://localhost:8501/v1/models/fashion_model:predict', data=data, headers=headers)
= json.loads(json_response.text)['predictions']

(0, 'The model thought this was a {} (class {}), and it was actually a {} (class {})'.format(
[np.argmax(predictions[0])], np.argmax(predictions[0]), class_names[test_labels[0]], test_labels[0]))

รุ่นเฉพาะของ servable

ตอนนี้ มาระบุเวอร์ชันเฉพาะของ Servable ของเรา เนื่องจากเรามีเพียงหนึ่ง ให้เลือกเวอร์ชัน 1 เราจะดูผลลัพธ์ทั้งสามด้วย

# docs_infra: no_execute
= {"content-type": "application/json"}
= requests.post('http://localhost:8501/v1/models/fashion_model/versions/1:predict', data=data, headers=headers)
= json.loads(json_response.text)['predictions']

for i in range(0,3):
(i, 'The model thought this was a {} (class {}), and it was actually a {} (class {})'.format(
[np.argmax(predictions[i])], np.argmax(predictions[i]), class_names[test_labels[i]], test_labels[i]))