Komponen Pipa TFX ContohValidator
Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Komponen pipeline ContohValidator mengidentifikasi anomali dalam pelatihan dan penyajian data. Itu dapat mendeteksi berbagai kelas anomali dalam data. Misalnya dapat:
- melakukan pemeriksaan validitas dengan membandingkan statistik data dengan skema yang mengkodifikasi harapan pengguna.
- mendeteksi kemiringan penyajian pelatihan dengan membandingkan data pelatihan dan penyajian.
- mendeteksi penyimpangan data dengan melihat serangkaian data.
- melakukan validasi khusus menggunakan konfigurasi berbasis SQL.
Komponen alur ContohValidator mengidentifikasi anomali apa pun dalam data contoh dengan membandingkan statistik data yang dihitung oleh komponen alur StatisticsGen terhadap skema. Skema yang disimpulkan mengkodifikasi properti yang diharapkan dapat dipenuhi oleh data masukan, dan dapat dimodifikasi oleh pengembang.
- Menggunakan: Skema dari komponen SchemaGen, dan statistik dari komponen StatisticsGen.
- Memancarkan : Hasil validasi
Validasi Data ContohValidator dan TensorFlow
ContohValidator memanfaatkan Validasi Data TensorFlow secara ekstensif untuk memvalidasi data masukan Anda.
Menggunakan Komponen ContohValidator
Komponen pipeline ContohValidator biasanya sangat mudah diterapkan dan memerlukan sedikit penyesuaian. Kode tipikal terlihat seperti ini:
validate_stats = ExampleValidator(
statistics=statistics_gen.outputs['statistics'],
schema=schema_gen.outputs['schema']
)
Detail lebih lanjut tersedia di referensi API ContohValidator .
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2025-07-25 UTC.
[null,null,["Terakhir diperbarui pada 2025-07-25 UTC."],[],[],null,["# The ExampleValidator TFX Pipeline Component\n\n\u003cbr /\u003e\n\nThe ExampleValidator pipeline component identifies anomalies in training and serving\ndata. It can detect different classes of anomalies in the data. For example it\ncan:\n\n1. perform validity checks by comparing data statistics against a schema that codifies expectations of the user.\n2. detect training-serving skew by comparing training and serving data.\n3. detect data drift by looking at a series of data.\n4. perform [custom validations](https://github.com/tensorflow/data-validation/blob/master/g3doc/custom_data_validation.md) using a SQL-based configuration.\n\nThe ExampleValidator pipeline component identifies any anomalies in the example data\nby comparing data statistics computed by the StatisticsGen pipeline component against a\nschema. The inferred schema codifies properties which the input data is expected to\nsatisfy, and can be modified by the developer.\n\n- Consumes: A schema from a SchemaGen component, and statistics from a StatisticsGen component.\n- Emits: Validation results\n\nExampleValidator and TensorFlow Data Validation\n-----------------------------------------------\n\nExampleValidator makes extensive use of [TensorFlow Data Validation](/tfx/guide/tfdv)\nfor validating your input data.\n\nUsing the ExampleValidator Component\n------------------------------------\n\nAn ExampleValidator pipeline component is typically very easy to deploy and\nrequires little customization. Typical code looks like this: \n\n validate_stats = ExampleValidator(\n statistics=statistics_gen.outputs['statistics'],\n schema=schema_gen.outputs['schema']\n )\n\nMore details are available in the\n[ExampleValidator API reference](https://www.tensorflow.org/tfx/api_docs/python/tfx/v1/components/ExampleValidator)."]]