مكون خط أنابيب exampleValidator TFX
تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
يحدد مكون خط الأنابيب exampleValidator الحالات الشاذة في التدريب وتقديم البيانات. يمكنه اكتشاف فئات مختلفة من الحالات الشاذة في البيانات. على سبيل المثال يمكن:
- إجراء فحوصات الصلاحية من خلال مقارنة إحصائيات البيانات مع المخطط الذي يقنن توقعات المستخدم.
- اكتشاف انحراف خدمة التدريب من خلال مقارنة بيانات التدريب والخدمة.
- اكتشاف انحراف البيانات من خلال النظر في سلسلة من البيانات.
- إجراء عمليات التحقق المخصصة باستخدام التكوين المستند إلى SQL.
يحدد مكون خط أنابيب exampleValidator أي حالات شاذة في بيانات المثال من خلال مقارنة إحصائيات البيانات المحسوبة بواسطة مكون خط أنابيب StatisticsGen مقابل المخطط. يقوم المخطط المستنتج بتدوين الخصائص التي من المتوقع أن تلبيها البيانات المدخلة، ويمكن للمطور تعديلها.
- يستهلك: مخطط من مكون SchemaGen، وإحصائيات من مكون StatisticsGen.
- تنبعث: نتائج التحقق من الصحة
exampleValidator والتحقق من صحة بيانات TensorFlow
يستخدم exampleValidator بشكل مكثف تقنية TensorFlow Data Validation للتحقق من صحة بيانات الإدخال الخاصة بك.
باستخدام مكون exampleValidator
عادةً ما يكون نشر مكون خط أنابيب exampleValidator سهلًا للغاية ويتطلب القليل من التخصيص. يبدو الرمز النموذجي كما يلي:
validate_stats = ExampleValidator(
statistics=statistics_gen.outputs['statistics'],
schema=schema_gen.outputs['schema']
)
تتوفر المزيد من التفاصيل في مرجع exampleValidator API .
إنّ محتوى هذه الصفحة مرخّص بموجب ترخيص Creative Commons Attribution 4.0 ما لم يُنصّ على خلاف ذلك، ونماذج الرموز مرخّصة بموجب ترخيص Apache 2.0. للاطّلاع على التفاصيل، يُرجى مراجعة سياسات موقع Google Developers. إنّ Java هي علامة تجارية مسجَّلة لشركة Oracle و/أو شركائها التابعين.
تاريخ التعديل الأخير: 2025-07-25 (حسب التوقيت العالمي المتفَّق عليه)
[null,null,["تاريخ التعديل الأخير: 2025-07-25 (حسب التوقيت العالمي المتفَّق عليه)"],[],[],null,["# The ExampleValidator TFX Pipeline Component\n\n\u003cbr /\u003e\n\nThe ExampleValidator pipeline component identifies anomalies in training and serving\ndata. It can detect different classes of anomalies in the data. For example it\ncan:\n\n1. perform validity checks by comparing data statistics against a schema that codifies expectations of the user.\n2. detect training-serving skew by comparing training and serving data.\n3. detect data drift by looking at a series of data.\n4. perform [custom validations](https://github.com/tensorflow/data-validation/blob/master/g3doc/custom_data_validation.md) using a SQL-based configuration.\n\nThe ExampleValidator pipeline component identifies any anomalies in the example data\nby comparing data statistics computed by the StatisticsGen pipeline component against a\nschema. The inferred schema codifies properties which the input data is expected to\nsatisfy, and can be modified by the developer.\n\n- Consumes: A schema from a SchemaGen component, and statistics from a StatisticsGen component.\n- Emits: Validation results\n\nExampleValidator and TensorFlow Data Validation\n-----------------------------------------------\n\nExampleValidator makes extensive use of [TensorFlow Data Validation](/tfx/guide/tfdv)\nfor validating your input data.\n\nUsing the ExampleValidator Component\n------------------------------------\n\nAn ExampleValidator pipeline component is typically very easy to deploy and\nrequires little customization. Typical code looks like this: \n\n validate_stats = ExampleValidator(\n statistics=statistics_gen.outputs['statistics'],\n schema=schema_gen.outputs['schema']\n )\n\nMore details are available in the\n[ExampleValidator API reference](https://www.tensorflow.org/tfx/api_docs/python/tfx/v1/components/ExampleValidator)."]]