רכיב ה-ExampleValidator TFX Pipeline
קל לארגן דפים בעזרת אוספים
אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.
רכיב הצינור של ExampleValidator מזהה חריגות בנתוני ההדרכה וההגשה. זה יכול לזהות סוגים שונים של חריגות בנתונים. למשל זה יכול:
- לבצע בדיקות תקפות על ידי השוואת נתונים סטטיסטיים מול סכימה שמקודדת את הציפיות מהמשתמש.
- זיהוי הטיית אימון-הגשה על-ידי השוואת נתוני ההדרכה וההגשה.
- לזהות סחיפה של נתונים על ידי התבוננות בסדרה של נתונים.
- לבצע אימותים מותאמים אישית באמצעות תצורה מבוססת SQL.
רכיב הצינור של ExampleValidator מזהה חריגות כלשהן בנתוני הדוגמה על ידי השוואת נתונים סטטיסטיים המחושבים על ידי רכיב הצינור של StatisticsGen מול סכימה. הסכימה המוסקת מקודדת מאפיינים שנתוני הקלט צפויים לעמוד בהם, וניתן לשנותם על ידי המפתח.
- צורכת: סכימה מרכיב SchemaGen, וסטטיסטיקה מרכיב StatisticsGen.
- פולטות: תוצאות אימות
אימות נתונים לדוגמה ו- TensorFlow
ExampleValidator עושה שימוש נרחב ב- TensorFlow Data Validation לאימות נתוני הקלט שלך.
שימוש ברכיב ExampleValidator
רכיב צינור של ExampleValidator הוא בדרך כלל קל מאוד לפריסה ודורש מעט התאמה אישית. קוד טיפוסי נראה כך:
validate_stats = ExampleValidator(
statistics=statistics_gen.outputs['statistics'],
schema=schema_gen.outputs['schema']
)
פרטים נוספים זמינים בהפניה ל-ExampleValidator API .
אלא אם צוין אחרת, התוכן של דף זה הוא ברישיון Creative Commons Attribution 4.0 ודוגמאות הקוד הן ברישיון Apache 2.0. לפרטים, ניתן לעיין במדיניות האתר Google Developers. Java הוא סימן מסחרי רשום של חברת Oracle ו/או של השותפים העצמאיים שלה.
עדכון אחרון: 2025-07-25 (שעון UTC).
[null,null,["עדכון אחרון: 2025-07-25 (שעון UTC)."],[],[],null,["# The ExampleValidator TFX Pipeline Component\n\n\u003cbr /\u003e\n\nThe ExampleValidator pipeline component identifies anomalies in training and serving\ndata. It can detect different classes of anomalies in the data. For example it\ncan:\n\n1. perform validity checks by comparing data statistics against a schema that codifies expectations of the user.\n2. detect training-serving skew by comparing training and serving data.\n3. detect data drift by looking at a series of data.\n4. perform [custom validations](https://github.com/tensorflow/data-validation/blob/master/g3doc/custom_data_validation.md) using a SQL-based configuration.\n\nThe ExampleValidator pipeline component identifies any anomalies in the example data\nby comparing data statistics computed by the StatisticsGen pipeline component against a\nschema. The inferred schema codifies properties which the input data is expected to\nsatisfy, and can be modified by the developer.\n\n- Consumes: A schema from a SchemaGen component, and statistics from a StatisticsGen component.\n- Emits: Validation results\n\nExampleValidator and TensorFlow Data Validation\n-----------------------------------------------\n\nExampleValidator makes extensive use of [TensorFlow Data Validation](/tfx/guide/tfdv)\nfor validating your input data.\n\nUsing the ExampleValidator Component\n------------------------------------\n\nAn ExampleValidator pipeline component is typically very easy to deploy and\nrequires little customization. Typical code looks like this: \n\n validate_stats = ExampleValidator(\n statistics=statistics_gen.outputs['statistics'],\n schema=schema_gen.outputs['schema']\n )\n\nMore details are available in the\n[ExampleValidator API reference](https://www.tensorflow.org/tfx/api_docs/python/tfx/v1/components/ExampleValidator)."]]