
מסמך זה מציג את tf.estimator - API ברמה גבוהה של TensorFlow. אומדנים כוללים את הפעולות הבאות:

  • הַדְרָכָה
  • הַעֲרָכָה
  • נְבוּאָה
  • ייצוא להגשה

TensorFlow מיישמת מספר אומדנים מוכנים מראש. אומדנים מותאמים אישית עדיין נתמכים, אבל בעיקר כאמצעי תאימות לאחור. אין להשתמש באומדנים מותאמים אישית עבור קוד חדש . כל האומדנים - מוכנים מראש או מותאמים אישית - הם מחלקות המבוססות על המחלקה tf.estimator.Estimator .

לדוגמא מהירה, נסה את מדריכי האומדן . לסקירה כללית של עיצוב ה-API, עיין בנייר הלבן .


pip install -U tensorflow_datasets
import tempfile
import os

import tensorflow as tf
import tensorflow_datasets as tfds


בדומה ל- tf.keras.Model , estimator הוא הפשטה ברמת המודל. ה- tf.estimator מספק כמה יכולות כרגע עדיין בפיתוח עבור tf.keras . אלו הם:

  • אימון מבוסס שרת פרמטרים
  • אינטגרציה מלאה של TFX

יכולות אומדנים

אומדנים מספקים את היתרונות הבאים:

  • אתה יכול להפעיל מודלים מבוססי Estimator על מארח מקומי או על סביבת ריבוי שרתים מבוזרת מבלי לשנות את המודל שלך. יתרה מזאת, אתה יכול להריץ מודלים מבוססי Estimator על CPUs, GPUs או TPUs מבלי לקוד מחדש את המודל שלך.
  • האומדנים מספקים לולאת אימון מבוזרת בטוחה השולטת כיצד ומתי:
    • לטעון מידע
    • לטפל בחריגים
    • צור קבצי מחסום והתאושש מתקלות
    • שמור סיכומים עבור TensorBoard

בעת כתיבת אפליקציה עם Estimators, עליך להפריד את צינור קלט הנתונים מהמודל. הפרדה זו מפשטת ניסויים עם מערכי נתונים שונים.

שימוש באומדנים מוכנים מראש

אומדנים מוכנים מראש מאפשרים לך לעבוד ברמה קונספטואלית גבוהה בהרבה מזו של ממשקי ה-API של TensorFlow הבסיסיים. אתה כבר לא צריך לדאוג לגבי יצירת הגרף החישובי או ההפעלות מכיוון שאומדנים מטפלים בכל ה"צנרת" עבורך. יתר על כן, אומדנים מוכנים מראש מאפשרים לך להתנסות בארכיטקטורות מודלים שונות על ידי ביצוע שינויים קוד מינימליים בלבד. tf.estimator.DNNClassifier , למשל, היא מחלקת Estimator שהוכנה מראש, המאמנת מודלים של סיווג המבוססים על רשתות עצביות צפופות ומזינות קדימה.

תוכנית TensorFlow הנשענת על אומדן שהוכן מראש מורכבת בדרך כלל מארבעת השלבים הבאים:

1. כתוב פונקציות קלט

לדוגמה, תוכל ליצור פונקציה אחת לייבוא ​​ערכת ההדרכה ופונקציה אחרת לייבא את ערכת הבדיקות. מעריכים מצפים שהקלטים שלהם יהיו מעוצבים כזוג אובייקטים:

  • מילון שבו המפתחות הם שמות תכונה והערכים הם Tensors (או SparseTensors) המכילים את נתוני התכונה המתאימים
  • טנסור המכיל תווית אחת או יותר

ה- input_fn צריך להחזיר tf.data.Dataset שמניב זוגות בפורמט הזה.

לדוגמה, הקוד הבא בונה tf.data.Dataset מקובץ train.csv של מערך הנתונים של Titanic:

def train_input_fn():
= tf.keras.utils.get_file("train.csv", "https://storage.googleapis.com/tf-datasets/titanic/train.csv")
= tf.data.experimental.make_csv_dataset(
, batch_size=32,
= (
return titanic_batches

ה- input_fn מבוצע ב- tf.Graph ויכול גם להחזיר ישירות זוג (features_dics, labels) המכיל טנסור גרפים, אבל זה נוטה לשגיאה מחוץ למקרים פשוטים כמו החזרת קבועים.

2. הגדר את עמודות התכונה.

כל tf.feature_column מזהה שם תכונה, סוגה וכל עיבוד מקדים של קלט.

לדוגמה, הקטע הבא יוצר שלוש עמודות תכונה.

  • הראשון משתמש בתכונת age ישירות כקלט של נקודה צפה.
  • השני משתמש בתכונת class כקלט קטגורי.
  • השלישי משתמש ב- embark_town כקלט קטגורי, אך משתמש hashing trick כדי למנוע את הצורך למנות את האפשרויות ולקבוע את מספר האפשרויות.

למידע נוסף, עיין במדריך עמודות תכונה .

age = tf.feature_column.numeric_column('age')
= tf.feature_column.categorical_column_with_vocabulary_list('class', ['First', 'Second', 'Third'])
= tf.feature_column.categorical_column_with_hash_bucket('embark_town', 32)

3. הצג את האומד הרלוונטי המוכן מראש.

לדוגמה, הנה דוגמה לדוגמה של הערכה מוכנה מראש בשם LinearClassifier :

model_dir = tempfile.mkdtemp()
= tf.estimator.LinearClassifier(
=[embark, cls, age],
למידע נוסף, תוכל לעבור למדריך המסווג הליניארי .

4. קרא לשיטת אימון, הערכה או מסקנות.

כל האומדנים מספקים שיטות train , evaluate predict .

model = model.train(input_fn=train_input_fn, steps=100)
result = model.evaluate(train_input_fn, steps=10)

for key, value in result.items():
print(key, ":", value)
accuracy : 0.734375
accuracy_baseline : 0.640625
auc : 0.7373913
auc_precision_recall : 0.64306235
average_loss : 0.563341
label/mean : 0.359375
loss : 0.563341
precision : 0.734375
prediction/mean : 0.3463129
recall : 0.40869564
global_step : 100
2021-09-22 20:49:12.168629: W tensorflow/core/kernels/data/cache_dataset_ops.cc:768] The calling iterator did not fully read the dataset being cached. In order to avoid unexpected truncation of the dataset, the partially cached contents of the dataset  will be discarded. This can happen if you have an input pipeline similar to `dataset.cache().take(k).repeat()`. You should use `dataset.take(k).cache().repeat()` instead.
for pred in model.predict(train_input_fn):
for key, value in pred.items():
print(key, ":", value)
היתרונות של אומדנים מוכנים מראש

מעריכים מוכנים מראש מקודדים שיטות עבודה מומלצות, ומספקים את היתרונות הבאים:

  • שיטות עבודה מומלצות לקביעה היכן חלקים שונים של הגרף החישובי צריכים לפעול, יישום אסטרטגיות במכונה בודדת או באשכול.
  • שיטות עבודה מומלצות לכתיבת אירועים (סיכום) וסיכומים שימושיים אוניברסליים.

אם אינך משתמש באומדנים מוכנים מראש, עליך ליישם את התכונות הקודמות בעצמך.

אומדנים מותאמים אישית

הלב של כל הערכה - בין אם הוא מוכן מראש או בהתאמה אישית - הוא פונקציית המודל שלו, model_fn , שהיא שיטה שבונה גרפים לאימון, הערכה וחיזוי. כאשר אתה משתמש באומדן שהוכן מראש, מישהו אחר כבר יישם את פונקציית המודל. כאשר מסתמכים על אומדן מותאם אישית, עליך לכתוב את פונקציית המודל בעצמך.

צור מעריך מדגם Keras

אתה יכול להמיר מודלים קיימים של Keras ל-Estimators עם tf.keras.estimator.model_to_estimator . זה מועיל אם ברצונך לחדש את קוד הדגם שלך, אך צינור ההדרכה שלך עדיין דורש מעריכים.

הצג דגם של Keras MobileNet V2 והרכב את המודל עם כלי האופטימיזציה, האובדן והמדדים להתאמן איתם:

keras_mobilenet_v2 = tf.keras.applications.MobileNetV2(
=(160, 160, 3), include_top=False)
.trainable = False

= tf.keras.Sequential([

# Compile the model
צור Estimator ממודל Keras המלוקט. מצב המודל הראשוני של מודל Estimator נשמר באומדן שנוצר:

est_mobilenet_v2 = tf.keras.estimator.model_to_estimator(keras_model=estimator_model)
התייחס Estimator הנגזר כפי שהיית מתייחס לכל Estimator אחר.

IMG_SIZE = 160  # All images will be resized to 160x160

def preprocess(image, label):
= tf.cast(image, tf.float32)
= (image/127.5) - 1
= tf.image.resize(image, (IMG_SIZE, IMG_SIZE))
return image, label
def train_input_fn(batch_size):
= tfds.load('cats_vs_dogs', as_supervised=True)
= data['train']
= train_data.map(preprocess).shuffle(500).batch(batch_size)
return train_data

כדי להתאמן, התקשר לפונקציית הרכבת של Estimator:

est_mobilenet_v2.train(input_fn=lambda: train_input_fn(32), steps=50)
באופן דומה, כדי להעריך, קרא לפונקציית ההערכה של האומד:

est_mobilenet_v2.evaluate(input_fn=lambda: train_input_fn(32), steps=10)
לפרטים נוספים, עיין בתיעוד עבור tf.keras.estimator.model_to_estimator .

שמירת מחסומים מבוססי אובייקטים עם Estimator

מעריכים כברירת מחדל שומרים נקודות ביקורת עם שמות משתנים במקום עם גרף האובייקטים המתואר במדריך המחסום . tf.train.Checkpoint יקרא נקודות ביקורת מבוססות שמות, אך שמות משתנים עשויים להשתנות בעת הזזת חלקים של מודל מחוץ ל- model_fn של האומד. עבור תאימות קדימה, שמירת נקודות ביקורת מבוססות אובייקטים מקלה על אימון מודל בתוך Estimator ולאחר מכן להשתמש בו מחוץ לאחד.

import tensorflow.compat.v1 as tf_compat
def toy_dataset():
= tf.range(10.)[:, None]
= inputs * 5. + tf.range(5.)[None, :]
return tf.data.Dataset.from_tensor_slices(
(x=inputs, y=labels)).repeat().batch(2)
class Net(tf.keras.Model):
"""A simple linear model."""

def __init__(self):
super(Net, self).__init__()
self.l1 = tf.keras.layers.Dense(5)

def call(self, x):
return self.l1(x)
def model_fn(features, labels, mode):
= Net()
= tf.keras.optimizers.Adam(0.1)
= tf.train.Checkpoint(step=tf_compat.train.get_global_step(),
=opt, net=net)
with tf.GradientTape() as tape:
= net(features['x'])
= tf.reduce_mean(tf.abs(output - features['y']))
= net.trainable_variables
= tape.gradient(loss, variables)
return tf.estimator.EstimatorSpec(
=tf.group(opt.apply_gradients(zip(gradients, variables)),
# Tell the Estimator to save "ckpt" in an object-based format.

= tf.estimator.Estimator(model_fn, './tf_estimator_example/')
.train(toy_dataset, steps=10)
לאחר מכן, tf.train.Checkpoint יכול לטעון את נקודות הבידוק של האומד מה- model_dir שלו.

opt = tf.keras.optimizers.Adam(0.1)
= Net()
= tf.train.Checkpoint(
=tf.Variable(1, dtype=tf.int64), optimizer=opt, net=net)
.step.numpy()  # From est.train(..., steps=10)

SavedModels מאת מעריכים

מעריכים מייצאים SavedModels דרך tf.Estimator.export_saved_model .

input_column = tf.feature_column.numeric_column("x")

= tf.estimator.LinearClassifier(feature_columns=[input_column])

def input_fn():
return tf.data.Dataset.from_tensor_slices(
({"x": [1., 2., 3., 4.]}, [1, 1, 0, 0])).repeat(200).shuffle(64).batch(16)
כדי לשמור Estimator אתה צריך ליצור serving_input_receiver . פונקציה זו בונה חלק מ- tf.Graph את הנתונים הגולמיים שהתקבלו על ידי SavedModel.

מודול tf.estimator.export מכיל פונקציות שיעזרו לבנות receivers אלה.

הקוד הבא בונה מקלט, המבוסס על feature_columns , שמקבל מאגרי פרוטוקול tf.Example בסידרה, המשמשים לעתים קרובות עם tf-serving .

tmpdir = tempfile.mkdtemp()

= tf.estimator.export.build_parsing_serving_input_receiver_fn(

= os.path.join(tmpdir, 'from_estimator')
= estimator.export_saved_model(estimator_base_path, serving_input_fn)
אתה יכול גם לטעון ולהפעיל את המודל הזה, מ-python:

imported = tf.saved_model.load(estimator_path)

def predict(x):
= tf.train.Example()
return imported.signatures["predict"](
{'class_ids': <tf.Tensor: shape=(1, 1), dtype=int64, numpy=array([[1]])>, 'classes': <tf.Tensor: shape=(1, 1), dtype=string, numpy=array([[b'1']], dtype=object)>, 'all_classes': <tf.Tensor: shape=(1, 2), dtype=string, numpy=array([[b'0', b'1']], dtype=object)>, 'all_class_ids': <tf.Tensor: shape=(1, 2), dtype=int32, numpy=array([[0, 1]], dtype=int32)>, 'logits': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[0.2974025]], dtype=float32)>, 'logistic': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[0.5738074]], dtype=float32)>, 'probabilities': <tf.Tensor: shape=(1, 2), dtype=float32, numpy=array([[0.42619258, 0.5738074 ]], dtype=float32)>}
{'class_ids': <tf.Tensor: shape=(1, 1), dtype=int64, numpy=array([[0]])>, 'classes': <tf.Tensor: shape=(1, 1), dtype=string, numpy=array([[b'0']], dtype=object)>, 'all_classes': <tf.Tensor: shape=(1, 2), dtype=string, numpy=array([[b'0', b'1']], dtype=object)>, 'all_class_ids': <tf.Tensor: shape=(1, 2), dtype=int32, numpy=array([[0, 1]], dtype=int32)>, 'logits': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[-1.1919093]], dtype=float32)>, 'logistic': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[0.23291764]], dtype=float32)>, 'probabilities': <tf.Tensor: shape=(1, 2), dtype=float32, numpy=array([[0.7670824 , 0.23291762]], dtype=float32)>}

tf.estimator.export.build_raw_serving_input_receiver_fn מאפשר לך ליצור פונקציות קלט שלוקחות טנזורים גולמיים ולא tf.train.Example s.

שימוש ב- tf.distribute.Strategy עם Estimator (תמיכה מוגבלת)

tf.estimator הוא API של הדרכה מבוזר של TensorFlow שתמך במקור בגישת שרת פרמטרים אסינכרוניים. tf.estimator תומך כעת ב- tf.distribute.Strategy . אם אתה משתמש ב- tf.estimator , אתה יכול לעבור לאימון מבוזר עם מעט מאוד שינויים בקוד שלך. עם זה, משתמשי Estimator יכולים כעת לבצע אימון מבוזר סינכרוני על מספר GPUs ומספר עובדים, כמו גם להשתמש ב-TPUs. עם זאת, תמיכה זו באומדן מוגבלת. עיין בסעיף מה נתמך עכשיו למטה לפרטים נוספים.

השימוש ב- tf.distribute.Strategy עם Estimator שונה במקצת מאשר במקרה של Keras. במקום להשתמש ב-strategi.scope, כעת אתה מעביר את אובייקט strategy.scope ל- RunConfig עבור האומד.

אתה יכול לעיין במדריך ההדרכה המבוזר למידע נוסף.

להלן קטע קוד שמראה זאת עם Estimator LinearRegressor ו- MirroredStrategy שהוכן מראש:

mirrored_strategy = tf.distribute.MirroredStrategy()
= tf.estimator.RunConfig(
=mirrored_strategy, eval_distribute=mirrored_strategy)
= tf.estimator.LinearRegressor(
כאן, אתה משתמש באומד מראש, אבל אותו קוד עובד גם עם אומד מותאם אישית. train_distribute קובע כיצד ההדרכה תחולק, ו- eval_distribute קובעת כיצד תחולק הערכה. זהו הבדל נוסף מ-Keras שבו אתה משתמש באותה אסטרטגיה גם לאימון וגם לאיוואל.

כעת אתה יכול לאמן ולהעריך את האומד הזה עם פונקציית קלט:

def input_fn():
= tf.data.Dataset.from_tensors(({"feats":[1.]}, [1.]))
return dataset.repeat(1000).batch(10)
.train(input_fn=input_fn, steps=10)
.evaluate(input_fn=input_fn, steps=10)
הבדל נוסף שיש להדגיש כאן בין Estimator ל-Keras הוא הטיפול בקלט. ב-Keras, כל אצווה של מערך הנתונים מפוצלת באופן אוטומטי על פני ההעתקים המרובים. עם זאת, ב-Estimator, אינך מבצע פיצול אצווה אוטומטי, ואינו מפיץ את הנתונים באופן אוטומטי בין עובדים שונים. יש לך שליטה מלאה על האופן שבו אתה רוצה שהנתונים שלך יופצו על פני עובדים ומכשירים, ועליך לספק input_fn כדי לציין כיצד להפיץ את הנתונים שלך.

input_fn שלך נקרא פעם אחת לכל עובד, ובכך נותן מערך נתונים אחד לכל עובד. אז אצווה אחת מאותו מערך נתונים מוזנת לעתק אחד באותו עובד, ובכך צורכת N אצווה עבור N העתקים בעובד אחד. במילים אחרות, מערך הנתונים המוחזר על ידי ה- input_fn צריך לספק אצוות בגודל PER_REPLICA_BATCH_SIZE . וניתן לקבל את גודל האצווה הגלובלי עבור שלב כ- PER_REPLICA_BATCH_SIZE * strategy.num_replicas_in_sync .

בעת ביצוע הכשרה מרובה עובדים, עליך לפצל את הנתונים שלך בין העובדים, או לערבב עם סיד אקראי על כל אחד מהם. אתה יכול לבדוק דוגמה כיצד לעשות זאת במדריך הדרכה ריבוי עובדים עם הערכה .

ובאופן דומה, אתה יכול להשתמש גם באסטרטגיות ריבוי עובדים ושרת פרמטרים. הקוד נשאר זהה, אבל עליך להשתמש ב- tf.estimator.train_and_evaluate ולהגדיר משתני סביבה TF_CONFIG עבור כל בינארי הפועל באשכול שלך.

מה נתמך עכשיו?

קיימת תמיכה מוגבלת לאימון עם Estimator תוך שימוש בכל האסטרטגיות למעט TPUStrategy . הכשרה והערכה בסיסית אמורות לעבוד, אך מספר תכונות מתקדמות כגון v1.train.Scaffold לא. ייתכנו גם מספר באגים באינטגרציה הזו ואין תוכניות לשפר את התמיכה הזו באופן אקטיבי (ההתמקדות היא ב-Keras ותמיכה בלולאת אימון מותאמת אישית). אם זה אפשרי, עליך להעדיף להשתמש ב- tf.distribute עם ממשקי API אלה במקום זאת.

הדרכה API אסטרטגיית מראה אסטרטגיה של TPUS אסטרטגיית MultiWorkerMirrored אסטרטגיית אחסון מרכזית ParameterServerStrategy
API של Estimator תמיכה מוגבלת אינו נתמך תמיכה מוגבלת תמיכה מוגבלת תמיכה מוגבלת

דוגמאות והדרכות

הנה כמה דוגמאות מקצה לקצה שמראות כיצד להשתמש באסטרטגיות שונות עם אומדן:

  1. ערכת הדרכה מרובה עובדים עם אומדן מראה כיצד ניתן להתאמן עם מספר עובדים באמצעות MultiWorkerMirroredStrategy במערך הנתונים של MNIST.
  2. דוגמה מקצה לקצה להפעלת הכשרה מרובת עובדים עם אסטרטגיות הפצה ב- tensorflow/ecosystem באמצעות תבניות Kubernetes. זה מתחיל במודל Keras וממיר אותו ל-Estimator באמצעות tf.keras.estimator.model_to_estimator API.
  3. הדגם הרשמי של ResNet50 , שניתן לאמן אותו באמצעות MirroredStrategy או MultiWorkerMirroredStrategy .