คอมโพเนนต์ไปป์ไลน์ TFX ExampleValidator
จัดทุกอย่างให้เป็นระเบียบอยู่เสมอด้วยคอลเล็กชัน
บันทึกและจัดหมวดหมู่เนื้อหาตามค่ากำหนดของคุณ
ส่วนประกอบไปป์ไลน์ ExampleValidator ระบุความผิดปกติในข้อมูลการฝึกและการให้บริการ สามารถตรวจจับความผิดปกติประเภทต่างๆ ในข้อมูลได้ ตัวอย่างเช่น มันสามารถ:
- ดำเนินการตรวจสอบความถูกต้องโดยการเปรียบเทียบสถิติข้อมูลกับสคีมาที่ประมวลผลความคาดหวังของผู้ใช้
- ตรวจจับการบิดเบือนการให้บริการการฝึกอบรมโดยการเปรียบเทียบข้อมูลการฝึกอบรมและการให้บริการ
- ตรวจจับการเบี่ยงเบนของข้อมูลโดยดูจากชุดข้อมูล
- ดำเนิน การตรวจสอบแบบกำหนดเอง โดยใช้การกำหนดค่าแบบ SQL
ส่วนประกอบไปป์ไลน์ ExampleValidator ระบุความผิดปกติใดๆ ในข้อมูลตัวอย่างโดยการเปรียบเทียบสถิติข้อมูลที่คำนวณโดยส่วนประกอบไปป์ไลน์ StatisticsGen กับสคีมา สคีมาที่อนุมานจะเข้ารหัสคุณสมบัติที่ข้อมูลอินพุตคาดว่าจะเป็นไปตามนั้น และนักพัฒนาสามารถแก้ไขได้
- ใช้: สคีมาจากองค์ประกอบ SchemaGen และสถิติจากองค์ประกอบ StatisticsGen
- ปล่อย: ผลการตรวจสอบ
ExampleValidator และการตรวจสอบข้อมูล TensorFlow
ExampleValidator ใช้ TensorFlow Data Validation อย่างกว้างขวางเพื่อตรวจสอบข้อมูลอินพุตของคุณ
การใช้ส่วนประกอบ ExampleValidator
โดยทั่วไปส่วนประกอบไปป์ไลน์ ExampleValidator นั้นง่ายต่อการปรับใช้และต้องการการปรับแต่งเพียงเล็กน้อย รหัสทั่วไปมีลักษณะดังนี้:
validate_stats = ExampleValidator(
statistics=statistics_gen.outputs['statistics'],
schema=schema_gen.outputs['schema']
)
มีรายละเอียดเพิ่มเติมใน การอ้างอิง ExampleValidator API
เนื้อหาของหน้าเว็บนี้ได้รับอนุญาตภายใต้ใบอนุญาตที่ต้องระบุที่มาของครีเอทีฟคอมมอนส์ 4.0 และตัวอย่างโค้ดได้รับอนุญาตภายใต้ใบอนุญาต Apache 2.0 เว้นแต่จะระบุไว้เป็นอย่างอื่น โปรดดูรายละเอียดที่นโยบายเว็บไซต์ Google Developers Java เป็นเครื่องหมายการค้าจดทะเบียนของ Oracle และ/หรือบริษัทในเครือ
อัปเดตล่าสุด 2025-07-25 UTC
[null,null,["อัปเดตล่าสุด 2025-07-25 UTC"],[],[],null,["# The ExampleValidator TFX Pipeline Component\n\n\u003cbr /\u003e\n\nThe ExampleValidator pipeline component identifies anomalies in training and serving\ndata. It can detect different classes of anomalies in the data. For example it\ncan:\n\n1. perform validity checks by comparing data statistics against a schema that codifies expectations of the user.\n2. detect training-serving skew by comparing training and serving data.\n3. detect data drift by looking at a series of data.\n4. perform [custom validations](https://github.com/tensorflow/data-validation/blob/master/g3doc/custom_data_validation.md) using a SQL-based configuration.\n\nThe ExampleValidator pipeline component identifies any anomalies in the example data\nby comparing data statistics computed by the StatisticsGen pipeline component against a\nschema. The inferred schema codifies properties which the input data is expected to\nsatisfy, and can be modified by the developer.\n\n- Consumes: A schema from a SchemaGen component, and statistics from a StatisticsGen component.\n- Emits: Validation results\n\nExampleValidator and TensorFlow Data Validation\n-----------------------------------------------\n\nExampleValidator makes extensive use of [TensorFlow Data Validation](/tfx/guide/tfdv)\nfor validating your input data.\n\nUsing the ExampleValidator Component\n------------------------------------\n\nAn ExampleValidator pipeline component is typically very easy to deploy and\nrequires little customization. Typical code looks like this: \n\n validate_stats = ExampleValidator(\n statistics=statistics_gen.outputs['statistics'],\n schema=schema_gen.outputs['schema']\n )\n\nMore details are available in the\n[ExampleValidator API reference](https://www.tensorflow.org/tfx/api_docs/python/tfx/v1/components/ExampleValidator)."]]