המר את טנסור ה-'קלט' המכומתי ל'פלט' בעל דיוק נמוך יותר, באמצעות ה-
הפצה בפועל של הערכים כדי למקסם את השימוש בעומק הסיביות התחתון והתאמת טווחי המינימום והמקסימום של הפלט בהתאם.
[input_min, input_max] הם צפים סקלאריים המציינים את הטווח עבור פרשנות הציפה של נתוני 'הקלט'. לדוגמה, אם input_min הוא -1.0f ו-input_max הוא 1.0f, ואנו עוסקים בנתונים quantized quant16, אז יש לפרש ערך 0 בנתונים של 16 סיביות כ-1.0f, ו-65535 פירושו 1.0f.
אופרטור זה מנסה לסחוט כמה שיותר דיוק לתוך פלט עם עומק סיביות נמוך יותר על ידי חישוב ערכי המינימום והמקסימום בפועל שנמצאו בנתונים. לדוגמה, אולי לקלט של quint16 אין ערכים נמוכים מ-16,384 ואף לא גבוה מ-49,152. זה אומר שרק חצי מהטווח נחוצים בפועל, כל הפירושים הצפים הם בין -0.5f ל-0.5f, כך שאם אנחנו רוצים לדחוס את הנתונים לפלט quint8, נוכל להשתמש בטווח הזה ולא ב-1.0f התיאורטי עד 1.0 f המוצע על ידי הקלט min ו-max.
בפועל, זה שימושי ביותר עבור נטילת פלט מפעולות כמו QuantizedMatMul שיכולות לייצר פלטים בעומק סיביות גבוהים יותר מהכניסות שלהן ועשויות להיות בעלות טווחי פלט פוטנציאליים גדולים, אך בפועל יש להן התפלגות ערכי קלט שמשתמשת רק בחלק קטן של טווח אפשרי. על ידי הזנת הפלט לאופרטור הזה, נוכל לצמצם אותו מ-32 סיביות ל-8 עם אובדן דיוק מינימלי.
קבועים
חוּט | OP_NAME | השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow |
שיטות ציבוריות
static <U מרחיב את TType > QuantizeDownAndShrinkRange <U> | |
פלט <U> | פלט () |
פלט < TFloat32 > | OutputMax () הערך הצף שערך הפלט המקוונטי המקסימלי מייצג. |
פלט < TFloat32 > | outputMin () הערך הצף שערך הפלט המקוונטי המינימלי מייצג. |
שיטות בירושה
קבועים
מחרוזת סופית סטטית ציבורית OP_NAME
השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow
שיטות ציבוריות
public static QuantizeDownAndShrinkRange <U> create ( scope scope, Operand <? מרחיב את TType > input, Operand < TFloat32 > inputMin, Operand < TFloat32 > inputMax, Class<U> outType)
שיטת Factory ליצירת מחלקה העוטפת פעולת QuantizeDownAndShrinkRange חדשה.
פרמטרים
תְחוּם | ההיקף הנוכחי |
---|---|
inputMin | הערך הצף שערך הקלט המקוונטי המינימלי מייצג. |
inputMax | הערך הצף שערך הקלט המקוונטי המקסימלי מייצג. |
outType | סוג הפלט. צריך להיות עומק סיביות נמוך יותר מ- Tinput. |
החזרות
- מופע חדש של QuantizeDownAndShrinkRange