El componente de canalización TFX de exampleValidator
Organízate con las colecciones
Guarda y clasifica el contenido según tus preferencias.
El componente de canalización EjemploValidator identifica anomalías en el entrenamiento y el suministro de datos. Puede detectar diferentes clases de anomalías en los datos. Por ejemplo puede:
- realizar comprobaciones de validez comparando estadísticas de datos con un esquema que codifica las expectativas del usuario.
- detectar el sesgo en el servicio de capacitación comparando los datos de entrenamiento y servicio.
- detectar la desviación de datos observando una serie de datos.
- realizar validaciones personalizadas utilizando una configuración basada en SQL.
El componente de canalización EjemploValidator identifica cualquier anomalía en los datos de ejemplo comparando las estadísticas de datos calculadas por el componente de canalización StatisticsGen con un esquema. El esquema inferido codifica propiedades que se espera que satisfagan los datos de entrada y que el desarrollador puede modificar.
- Consume: un esquema de un componente SchemaGen y estadísticas de un componente StatisticsGen.
- Emite: Resultados de validación
Ejemplo de validación de datos de Validador y TensorFlow
ExampleValidator hace un uso extensivo de TensorFlow Data Validation para validar sus datos de entrada.
Uso del componente Validador de ejemplo
Un componente de canalización de EjemploValidator suele ser muy fácil de implementar y requiere poca personalización. El código típico se ve así:
validate_stats = ExampleValidator(
statistics=statistics_gen.outputs['statistics'],
schema=schema_gen.outputs['schema']
)
Hay más detalles disponibles en la referencia de la API de ExampleValidator .
A menos que se indique lo contrario, el contenido de esta página está sujeto a la licencia Reconocimiento 4.0 de Creative Commons y las muestras de código están sujetas a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio web de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-07-25 (UTC).
[null,null,["Última actualización: 2025-07-25 (UTC)."],[],[],null,["# The ExampleValidator TFX Pipeline Component\n\n\u003cbr /\u003e\n\nThe ExampleValidator pipeline component identifies anomalies in training and serving\ndata. It can detect different classes of anomalies in the data. For example it\ncan:\n\n1. perform validity checks by comparing data statistics against a schema that codifies expectations of the user.\n2. detect training-serving skew by comparing training and serving data.\n3. detect data drift by looking at a series of data.\n4. perform [custom validations](https://github.com/tensorflow/data-validation/blob/master/g3doc/custom_data_validation.md) using a SQL-based configuration.\n\nThe ExampleValidator pipeline component identifies any anomalies in the example data\nby comparing data statistics computed by the StatisticsGen pipeline component against a\nschema. The inferred schema codifies properties which the input data is expected to\nsatisfy, and can be modified by the developer.\n\n- Consumes: A schema from a SchemaGen component, and statistics from a StatisticsGen component.\n- Emits: Validation results\n\nExampleValidator and TensorFlow Data Validation\n-----------------------------------------------\n\nExampleValidator makes extensive use of [TensorFlow Data Validation](/tfx/guide/tfdv)\nfor validating your input data.\n\nUsing the ExampleValidator Component\n------------------------------------\n\nAn ExampleValidator pipeline component is typically very easy to deploy and\nrequires little customization. Typical code looks like this: \n\n validate_stats = ExampleValidator(\n statistics=statistics_gen.outputs['statistics'],\n schema=schema_gen.outputs['schema']\n )\n\nMore details are available in the\n[ExampleValidator API reference](https://www.tensorflow.org/tfx/api_docs/python/tfx/v1/components/ExampleValidator)."]]