QuantizedMatMulWithBiasAndReluAndRequantize

כיתת גמר ציבורית QuantizedMatMulWithBiasAndReluAndRequantize

בצע כפל מטריצה ​​כמותית של 'a' במטריצה ​​'b' עם הטיה add ו-relu ו-requantize fusion.

הכניסות חייבות להיות מטריצות דו מימדיות ווקטור הטיה 1D. והממד הפנימי של `a` (לאחר המעבר אם `transposed_a` אינו אפס) חייב להתאים למימד החיצוני של `b` (לאחר ההעברה אם `transposed_b` אינו אפס). לאחר מכן בצע את פעולת הוספה של שידור עם ערכי הטיה על תוצאת הכפל המטריצה. גודל ההטיה חייב להתאים לממד הפנימי של 'b'. לאחר מכן בצע הפעלה מחדש כדי לקבל תוצאה לא שלילית. לאחר מכן, בצע כימות מחדש כדי לקבל תוצאת uint8 הסופית.

כיתות מקוננות

מעמד QuantizedMatMulWithBiasAndReluAndRequantize.Options תכונות אופציונליות עבור QuantizedMatMulWithBiasAndReluAndRequantize

קבועים

חוּט OP_NAME השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow

שיטות ציבוריות

סטטי <W מרחיב את TType > QuantizedMatMulWithBiasAndReluAndRequantize <W>
create ( scope scope, Operand <? מרחיב את TType > a, Operand <? מרחיב את TType > b, Operand <? מרחיב את TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Operand < TFloat32 > maxB, Operand < TFloat32 > minFreezedOutput, Operand < TFloat32 > maxFreezedOutput, Class<W> Toutput, Options... options)
שיטת מפעל ליצירת מחלקה העוטפת פעולת QuantizedMatMulWithBiasAndReluAndRequantize חדשה.
static QuantizedMatMulWithBiasAndReluAndRequantize.Options
inputQuantMode (מחרוזת inputQuantMode)
פלט < TFloat32 >
maxOut ()
הערך הצף שערך הפלט המקוונטי הגבוה ביותר מייצג.
פלט < TFloat32 >
minOut ()
הערך הצף שערך הפלט הקוונטי הנמוך ביותר מייצג.
פלט <W>
static QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeA (בוליאני transposeA)
static QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeB (טרנספוזי בוליאני)

שיטות בירושה

קבועים

מחרוזת סופית סטטית ציבורית OP_NAME

השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow

ערך קבוע: "QuantizedMatMulWithBiasAndReluAndRequantize"

שיטות ציבוריות

public static QuantizedMatMulWithBiasAndReluAndRequantize <W> create ( scope scope, Operand <? מרחיב את TType > a, Operand <? מרחיב את TType > b, Operand <? מרחיב את TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand > minB, Operand < TFloat32 > maxB, Operand < TFloat32 > minFreezedOutput, Operand < TFloat32 > maxFreezedOutput, Class<W> Toutput, Options... options)

שיטת מפעל ליצירת מחלקה העוטפת פעולת QuantizedMatMulWithBiasAndReluAndRequantize חדשה.

פרמטרים
תְחוּם ההיקף הנוכחי
א מטריצה ​​שיש להכפיל. חייב להיות טנזור דו מימדי מסוג 'quint8'.
ב מטריצה ​​שיש להכפיל וחייבת להיות טנזור דו מימדי מסוג `qint8`.
הֲטָיָה טנזור הטיה 1D עם התאמת גודל לממד הפנימי של 'b' (לאחר המעבר אם 'transposed_b' אינו אפס).
minA הערך הצף שערך ה-a' הקוונטי הנמוך ביותר מייצג.
maxA הערך הצף שערך ה-a' המכומת הגבוה ביותר מייצג.
minB הערך הצף שערך ה-'b' הקוונטי הנמוך ביותר מייצג.
maxB הערך הצף שערך ה-'b' המקוונטי הגבוה ביותר מייצג.
minFreezedOutput הערך הצף שערך הפלט המכומתי הגבוה ביותר לאחר כיבוי מחדש.
אפשרויות נושא ערכי תכונות אופציונליות
החזרות
  • מופע חדש של QuantizedMatMulWithBiasAndReluAndRequantize

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)

פרמטרים
inputQuantMode מצב כימות נתונים של קלט. MIN_FIRST (ברירת מחדל) או SCALED.

פלט ציבורי < TFloat32 > maxOut ()

הערך הצף שערך הפלט המקוונטי הגבוה ביותר מייצג.

פלט ציבורי < TFloat32 > minOut ()

הערך הצף שערך הפלט הקוונטי הנמוך ביותר מייצג.

פלט ציבורי <W> out ()

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolian transposeA)

פרמטרים
transposeA אם זה נכון, 'a' עובר טרנספוזיציה לפני הכפל.

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (בוליאני transposeB)

פרמטרים
transposeB אם זה נכון, 'b' עובר טרנספוזיציה לפני הכפל.