התאמן והגיש דגם TensorFlow עם הגשת TensorFlow

מדריך זה רכבות מודל רשת עצבית לסווג תמונות של בגדים, כמו נעלי ספורט וחולצות , חוסך המודל מאומן, ואז מגיש אותו עם TensorFlow הגשה . הדגש הוא על TensorFlow הגשה, ולא הדוגמנות והדרכת TensorFlow, כך עבור דוגמא שלמה המתמקד הדוגמנות וההכשרה לראות את דוגמא הסיווג הבסיסי .

מדריך זה משתמש tf.keras , ה- API ברמה גבוהה למודלים לבנות ורכבת TensorFlow.

import sys

# Confirm that we're using Python 3
assert sys.version_info.major == 3, 'Oops, not running Python 3. Use Runtime > Change runtime type'
# TensorFlow and tf.keras
print("Installing dependencies for Colab environment")
!pip install -Uq grpcio==1.26.0

import tensorflow as tf
from tensorflow import keras

# Helper libraries
import numpy as np
import matplotlib.pyplot as plt
import os
import subprocess

print('TensorFlow version: {}'.format(tf.__version__))

צור את הדגם שלך

ייבא את מערך הנתונים של Fashion MNIST

מדריך זה משתמש אופנה MNIST הנתונים המכיל 70,000 תמונות בגווני אפור ב 10 קטגוריות. התמונות מציגות פריטי לבוש בודדים ברזולוציה נמוכה (28 על 28 פיקסלים), כפי שניתן לראות כאן:

ספרייט MNIST אופנה
איור 1. דגימות אופנה-MNIST (על ידי Zalando, רישיון MIT).

אופנה MNIST מיועד לשמש נפתח ב תחליף עבור קלאסי MNIST במערך-קרובות משמש "שלום, עולם" של תוכניות לימוד מכונה עבור ראייה ממוחשבת. אתה יכול לגשת ל- Fashion MNIST ישירות מ- TensorFlow, פשוט לייבא ולטעון את הנתונים.

fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

# scale the values to 0.0 to 1.0
= train_images / 255.0
= test_images / 255.0

# reshape for feeding into the model
= train_images.reshape(train_images.shape[0], 28, 28, 1)
= test_images.reshape(test_images.shape[0], 28, 28, 1)

= ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

print('\ntrain_images.shape: {}, of {}'.format(train_images.shape, train_images.dtype))
print('test_images.shape: {}, of {}'.format(test_images.shape, test_images.dtype))
train_images.shape: (60000, 28, 28, 1), of float64
test_images.shape: (10000, 28, 28, 1), of float64

אימון והעריך את המודל שלך

בואו נשתמש ב-CNN הפשוט ביותר האפשרי, מכיוון שאנחנו לא מתמקדים בחלק הדוגמנות.

model = keras.Sequential([
.layers.Conv2D(input_shape=(28,28,1), filters=8, kernel_size=3,
=2, activation='relu', name='Conv1'),
.layers.Dense(10, name='Dense')

= False
= 5

.fit(train_images, train_labels, epochs=epochs)

, test_acc = model.evaluate(test_images, test_labels)
print('\nTest accuracy: {}'.format(test_acc))
Model: "sequential"
Layer (type)                 Output Shape              Param #   
Conv1 (Conv2D)               (None, 13, 13, 8)         80        
flatten (Flatten)            (None, 1352)              0         
Dense (Dense)                (None, 10)                13530     
Total params: 13,610
Trainable params: 13,610
Non-trainable params: 0
Test accuracy: 0.8737999796867371

שמור את הדגם שלך

כדי לטעון דגם המיומן שלנו לתוך TensorFlow הגשה תחילה עלינו להציל אותו SavedModel פורמט. פעולה זו תיצור קובץ protobuf בהיררכיית ספריות מוגדרת היטב, ויכלול מספר גרסה. הצגת TensorFlow מאפשרת לנו לבחור איזה גרסה של מודל, או "servable" אנחנו רוצים להשתמש כאשר אנו עושים בקשות היקש. כל גרסה תיוצא לספריית משנה אחרת תחת הנתיב הנתון.

# Fetch the Keras session and save the model
# The signature definition is defined by the input and output tensors,
# and stored with the default serving key
import tempfile

= tempfile.gettempdir()
= 1
= os.path.join(MODEL_DIR, str(version))
print('export_path = {}\n'.format(export_path))


print('\nSaved model:')
!ls -l {export_path}
export_path = /tmp/1
2021-12-04 10:29:53.392905: W tensorflow/python/util/util.cc:348] Sets are not currently considered sequences, but this may change in the future, so consider avoiding using them.
INFO:tensorflow:Assets written to: /tmp/1/assets

Saved model:
total 88
drwxr-xr-x 2 kbuilder kbuilder  4096 Dec  4 10:29 assets
-rw-rw-r-- 1 kbuilder kbuilder 78055 Dec  4 10:29 saved_model.pb
drwxr-xr-x 2 kbuilder kbuilder  4096 Dec  4 10:29 variables

בדוק את הדגם השמור שלך

אנו נשתמש בכלי שורת הפקודה saved_model_cli להסתכל על MetaGraphDefs (דגמי) ו SignatureDefs (שיטות אפשר לקרוא) ב SavedModel שלנו. ראה את הדיון הזה של CLI SavedModel במדריך TensorFlow.

saved_model_cli show --dir {export_path} --all
זה אומר לנו הרבה על הדגם שלנו! במקרה הזה פשוט אימנו את המודל שלנו, אז אנחנו כבר יודעים את התשומות והיציאות, אבל אם לא היינו, זה יהיה מידע חשוב. זה לא אומר לנו הכל, כמו העובדה שמדובר בנתוני תמונה בגווני אפור למשל, אבל זו התחלה מצוינת.

הגישו את הדגם שלכם עם TensorFlow Serving

הוסף את URI הפצה של TensorFlow Serving כמקור חבילה:

אנחנו מתכוננים להתקין TensorFlow הגשה באמצעות המיומנות מאז Colab זה פועל בסביבה דביאן. נוסיף את tensorflow-model-server החבילה לרשימת החבילות כי המיומנות יודעת על. שימו לב שאנחנו פועלים כשורש.

import sys
# We need sudo prefix if not on a Google Colab.
if 'google.colab' not in sys.modules:
= 'sudo'
= ''
# This is the same as you would do from your command line, but without the [arch=amd64], and no sudo
# You would instead do:
# echo "deb [arch=amd64] http://storage.googleapis.com/tensorflow-serving-apt stable tensorflow-model-server tensorflow-model-server-universal" | sudo tee /etc/apt/sources.list.d/tensorflow-serving.list && \
# curl https://storage.googleapis.com/tensorflow-serving-apt/tensorflow-serving.release.pub.gpg | sudo apt-key add -

!echo "deb http://storage.googleapis.com/tensorflow-serving-apt stable tensorflow-model-server tensorflow-model-server-universal" | {SUDO_IF_NEEDED} tee /etc/apt/sources.list.d/tensorflow-serving.list && \
curl https
://storage.googleapis.com/tensorflow-serving-apt/tensorflow-serving.release.pub.gpg | {SUDO_IF_NEEDED} apt-key add -
!{SUDO_IF_NEEDED} apt update
deb http://storage.googleapis.com/tensorflow-serving-apt stable tensorflow-model-server tensorflow-model-server-universal
התקן את TensorFlow Serving

זה כל מה שאתה צריך - שורת פקודה אחת!

{SUDO_IF_NEEDED} apt-get install tensorflow-model-server
התחל להפעיל את TensorFlow Serving

זה המקום שבו אנחנו מתחילים להפעיל את TensorFlow Serving ולטעון את המודל שלנו. לאחר טעינתו נוכל להתחיל לבצע בקשות להסיק באמצעות REST. יש כמה פרמטרים חשובים:

  • rest_api_port : הנמל, שבו תשתמש עבור בקשות REST.
  • model_name : עליך להשתמש באפשרות זו בכתובת ה- URL של בקשות REST. זה יכול להיות כל דבר.
  • model_base_path : זהו הנתיב אל הספרייה שבה שמרת המודל שלך.
os.environ["MODEL_DIR"] = MODEL_DIR
nohup tensorflow_model_server \
  --rest_api_port=8501 \
  --model_name=fashion_model \
  --model_base_path="${MODEL_DIR}" >server.log 2>&1
tail server.log

הגש בקשה לדגם שלך ב- TensorFlow Serving

ראשית, בואו נסתכל על דוגמה אקראית מנתוני הבדיקה שלנו.

def show(idx, title):
.title('\n\n{}'.format(title), fontdict={'size': 16})

import random
= random.randint(0,len(test_images)-1)
(rando, 'An Example Image: {}'.format(class_names[test_labels[rando]]))


אוקיי, זה נראה מעניין. כמה קשה לך לזהות את זה? כעת בואו ניצור את אובייקט ה-JSON עבור אצווה של שלוש בקשות להסיק, ונראה עד כמה המודל שלנו מזהה דברים:

import json
= json.dumps({"signature_name": "serving_default", "instances": test_images[0:3].tolist()})
print('Data: {} ... {}'.format(data[:50], data[len(data)-52:]))
Data: {"signature_name": "serving_default", "instances": ...  [0.0], [0.0], [0.0], [0.0], [0.0], [0.0], [0.0]]]]}

בצע בקשות REST

הגרסה החדשה ביותר של ההגשה

אנו נשלח בקשת חיזוי כ-POST לנקודת הקצה REST של השרת שלנו, ונעביר לה שלוש דוגמאות. נבקש מהשרת שלנו לתת לנו את הגרסה העדכנית ביותר של השרת שלנו על ידי אי ציון גרסה מסוימת.

# docs_infra: no_execute
!pip install -q requests

import requests
= {"content-type": "application/json"}
= requests.post('http://localhost:8501/v1/models/fashion_model:predict', data=data, headers=headers)
= json.loads(json_response.text)['predictions']

(0, 'The model thought this was a {} (class {}), and it was actually a {} (class {})'.format(
[np.argmax(predictions[0])], np.argmax(predictions[0]), class_names[test_labels[0]], test_labels[0]))

גרסה מסוימת של ההגשה

כעת בוא נציין גרסה מסוימת של קובץ ההגשה שלנו. מכיוון שיש לנו רק אחת, בוא נבחר גרסה 1. נסתכל גם על כל שלוש התוצאות.

# docs_infra: no_execute
= {"content-type": "application/json"}
= requests.post('http://localhost:8501/v1/models/fashion_model/versions/1:predict', data=data, headers=headers)
= json.loads(json_response.text)['predictions']

for i in range(0,3):
(i, 'The model thought this was a {} (class {}), and it was actually a {} (class {})'.format(
[np.argmax(predictions[i])], np.argmax(predictions[i]), class_names[test_labels[i]], test_labels[i]))