Thành phần đường dẫn TFX của Ví dụValidator
Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang
Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.
Thành phần quy trình exampleValidator xác định các điểm bất thường trong quá trình đào tạo và cung cấp dữ liệu. Nó có thể phát hiện các loại bất thường khác nhau trong dữ liệu. Ví dụ: nó có thể:
- thực hiện kiểm tra tính hợp lệ bằng cách so sánh số liệu thống kê dữ liệu với lược đồ mã hóa các kỳ vọng của người dùng.
- phát hiện độ lệch phục vụ đào tạo bằng cách so sánh dữ liệu đào tạo và phục vụ.
- phát hiện sự trôi dạt dữ liệu bằng cách xem xét một loạt dữ liệu.
- thực hiện xác thực tùy chỉnh bằng cách sử dụng cấu hình dựa trên SQL.
Thành phần đường dẫn exampleValidator xác định bất kỳ điểm bất thường nào trong dữ liệu mẫu bằng cách so sánh số liệu thống kê dữ liệu được tính toán bởi thành phần đường dẫn StatsGen với một lược đồ. Lược đồ được suy luận mã hóa các thuộc tính mà dữ liệu đầu vào dự kiến sẽ đáp ứng và nhà phát triển có thể sửa đổi.
- Tiêu thụ: Một lược đồ từ thành phần SchemaGen và số liệu thống kê từ thành phần StatsGen.
- Phát ra: Kết quả xác thực
Xác thực dữ liệu Ví dụValidator và TensorFlow
Ví dụValidator sử dụng rộng rãi Xác thực dữ liệu TensorFlow để xác thực dữ liệu đầu vào của bạn.
Sử dụng Thành phần Ví dụValidator
Thành phần quy trình exampleValidator thường rất dễ triển khai và yêu cầu ít tùy chỉnh. Mã điển hình trông như thế này:
validate_stats = ExampleValidator(
statistics=statistics_gen.outputs['statistics'],
schema=schema_gen.outputs['schema']
)
Thông tin chi tiết hơn có sẵn trong tài liệu tham khảo API exampleValidator .
Trừ phi có lưu ý khác, nội dung của trang này được cấp phép theo Giấy phép ghi nhận tác giả 4.0 của Creative Commons và các mẫu mã lập trình được cấp phép theo Giấy phép Apache 2.0. Để biết thông tin chi tiết, vui lòng tham khảo Chính sách trang web của Google Developers. Java là nhãn hiệu đã đăng ký của Oracle và/hoặc các đơn vị liên kết với Oracle.
Cập nhật lần gần đây nhất: 2025-07-25 UTC.
[null,null,["Cập nhật lần gần đây nhất: 2025-07-25 UTC."],[],[],null,["# The ExampleValidator TFX Pipeline Component\n\n\u003cbr /\u003e\n\nThe ExampleValidator pipeline component identifies anomalies in training and serving\ndata. It can detect different classes of anomalies in the data. For example it\ncan:\n\n1. perform validity checks by comparing data statistics against a schema that codifies expectations of the user.\n2. detect training-serving skew by comparing training and serving data.\n3. detect data drift by looking at a series of data.\n4. perform [custom validations](https://github.com/tensorflow/data-validation/blob/master/g3doc/custom_data_validation.md) using a SQL-based configuration.\n\nThe ExampleValidator pipeline component identifies any anomalies in the example data\nby comparing data statistics computed by the StatisticsGen pipeline component against a\nschema. The inferred schema codifies properties which the input data is expected to\nsatisfy, and can be modified by the developer.\n\n- Consumes: A schema from a SchemaGen component, and statistics from a StatisticsGen component.\n- Emits: Validation results\n\nExampleValidator and TensorFlow Data Validation\n-----------------------------------------------\n\nExampleValidator makes extensive use of [TensorFlow Data Validation](/tfx/guide/tfdv)\nfor validating your input data.\n\nUsing the ExampleValidator Component\n------------------------------------\n\nAn ExampleValidator pipeline component is typically very easy to deploy and\nrequires little customization. Typical code looks like this: \n\n validate_stats = ExampleValidator(\n statistics=statistics_gen.outputs['statistics'],\n schema=schema_gen.outputs['schema']\n )\n\nMore details are available in the\n[ExampleValidator API reference](https://www.tensorflow.org/tfx/api_docs/python/tfx/v1/components/ExampleValidator)."]]