Analisi del modello mediante TFX Pipeline e Analisi del modello TensorFlow

In questo tutorial basato su notebook, creeremo ed eseguiremo una pipeline TFX che crea un semplice modello di classificazione e ne analizza le prestazioni su più esecuzioni. Questo notebook è basato sul gasdotto TFX abbiamo costruito in semplice TFX Pipeline Tutorial . Se non hai ancora letto quel tutorial, dovresti leggerlo prima di procedere con questo taccuino.

Quando si modifica il modello o lo si addestra con un nuovo set di dati, è necessario verificare se il modello è migliorato o peggiorato. Il semplice controllo delle metriche di primo livello come la precisione potrebbe non essere sufficiente. Ogni modello addestrato dovrebbe essere valutato prima di essere inviato alla produzione.

Noi aggiungeremo un Evaluator componente pipeline creato nel precedente tutorial. Il componente Evaluator esegue un'analisi approfondita per i tuoi modelli e confronta il nuovo modello con una linea di base per determinare se sono "sufficientemente buoni". E 'implementato utilizzando il tensorflow modello di analisi biblioteca.

Si prega di consultare Capire TFX Pipelines per conoscere meglio i vari concetti in TFX.


Il processo di configurazione è lo stesso del tutorial precedente.

Per prima cosa dobbiamo installare il pacchetto TFX Python e scaricare il set di dati che utilizzeremo per il nostro modello.

Aggiorna Pip

Per evitare di aggiornare Pip in un sistema durante l'esecuzione in locale, verificare che stiamo eseguendo in Colab. I sistemi locali possono ovviamente essere aggiornati separatamente.

import colab
!pip install --upgrade pip

Installa TFX

pip install -U tfx

Hai riavviato il runtime?

Se stai utilizzando Google Colab, la prima volta che esegui la cella in alto, devi riavviare il runtime facendo clic sul pulsante "RIAVVIA RUNTIME" sopra o utilizzando il menu "Runtime > Riavvia runtime ...". Ciò è dovuto al modo in cui Colab carica i pacchetti.

Controlla le versioni TensorFlow e TFX.

import tensorflow as tf
print('TensorFlow version: {}'.format(tf.__version__))
from tfx import v1 as tfx
print('TFX version: {}'.format(tfx.__version__))
TensorFlow version: 2.6.2
TFX version: 1.4.0

Imposta variabili

Ci sono alcune variabili usate per definire una pipeline. Puoi personalizzare queste variabili come desideri. Per impostazione predefinita, tutto l'output dalla pipeline verrà generato nella directory corrente.

import os

= "penguin-tfma"

# Output directory to store artifacts generated from the pipeline.
= os.path.join('pipelines', PIPELINE_NAME)
# Path to a SQLite DB file to use as an MLMD storage.
= os.path.join('metadata', PIPELINE_NAME, 'metadata.db')
# Output directory where created models from the pipeline will be exported.
= os.path.join('serving_model', PIPELINE_NAME)

from absl import logging
.set_verbosity(logging.INFO)  # Set default logging level.

Prepara dati di esempio

Useremo lo stesso Palmer Penguins set di dati .

Ci sono quattro caratteristiche numeriche in questo set di dati che erano già normalizzate per avere un intervallo [0,1]. Costruiremo un modello di classificazione che prevede le species di pinguini.

Poiché TFX ExampleGen legge gli input da una directory, è necessario creare una directory e copiarvi il set di dati.

import urllib.request
import tempfile

= tempfile.mkdtemp(prefix='tfx-data')  # Create a temporary directory.
= ''
= os.path.join(DATA_ROOT, "data.csv")
.request.urlretrieve(_data_url, _data_filepath)
('/tmp/tfx-datal5lxy_yw/data.csv', <http.client.HTTPMessage at 0x7fa18a9da150>)

Crea una pipeline

Noi aggiungeremo un Evaluator componente al gasdotto che abbiamo creato nel semplice TFX Pipeline Tutorial .

Componente Un valutatore richiede dati in ingresso provenienti da un ExampleGen componente e un modello da un Trainer dei componenti e un tfma.EvalConfig oggetto. Possiamo facoltativamente fornire un modello di base che può essere utilizzato per confrontare le metriche con il modello appena addestrato.

Un valutatore crea due tipi di manufatti in uscita, ModelEvaluation e ModelBlessing . ModelEvaluation contiene il risultato dettagliato della valutazione che può essere analizzato e visualizzato ulteriormente con la libreria TFMA. ModelBlessing contiene un risultato booleano se il modello ha superato determinati criteri e può essere utilizzato in componenti successivi come un pusher come segnale.

Scrivi il codice di addestramento del modello

Useremo lo stesso codice del modello, come nel semplice TFX Pipeline Tutorial .

_trainer_module_file = ''
%%writefile {_trainer_module_file}

# Copied from

from typing import List
from absl import logging
import tensorflow as tf
from tensorflow import keras
from tensorflow_transform.tf_metadata import schema_utils

from tfx.components.trainer.executor import TrainerFnArgs
from tfx.components.trainer.fn_args_utils import DataAccessor
from tfx_bsl.tfxio import dataset_options
from tensorflow_metadata.proto.v0 import schema_pb2

= [
'culmen_length_mm', 'culmen_depth_mm', 'flipper_length_mm', 'body_mass_g'
= 'species'

= 20
= 10

# Since we're not generating or creating a schema, we will instead create
# a feature spec.  Since there are a fairly small number of features this is
# manageable for this dataset.
= {
:[1], dtype=tf.float32)
for feature in _FEATURE_KEYS
:[1], dtype=tf.int64)

def _input_fn(file_pattern: List[str],
: DataAccessor,
: schema_pb2.Schema,
: int = 200) ->
"""Generates features and label for training.

    file_pattern: List of paths or patterns of input tfrecord files.
    data_accessor: DataAccessor for converting input to RecordBatch.
    schema: schema of the input data.
    batch_size: representing the number of consecutive elements of returned
      dataset to combine in a single batch

    A dataset that contains (features, indices) tuple where features is a
      dictionary of Tensors, and indices is a single Tensor of label indices.

return data_accessor.tf_dataset_factory(
=batch_size, label_key=_LABEL_KEY),

def _build_keras_model() -> tf.keras.Model:
"""Creates a DNN Keras model for classifying penguin data.

    A Keras Model.

# The model below is built with Functional API, please refer to
# for all API options.
= [keras.layers.Input(shape=(1,), name=f) for f in _FEATURE_KEYS]
= keras.layers.concatenate(inputs)
for _ in range(2):
= keras.layers.Dense(8, activation='relu')(d)
= keras.layers.Dense(3)(d)

= keras.Model(inputs=inputs, outputs=outputs)

return model

# TFX Trainer will call this function.
def run_fn(fn_args: TrainerFnArgs):
"""Train the model based on given args.

    fn_args: Holds args used to train the model as name/value pairs.

# This schema is usually either an output of SchemaGen or a manually-curated
# version provided by pipeline author. A schema can also derived from TFT
# graph if a Transform component is used. In the case when either is missing,
# `schema_from_feature_spec` could be used to generate schema from very simple
# feature_spec, but the schema returned would be very primitive.
= schema_utils.schema_from_feature_spec(_FEATURE_SPEC)

= _input_fn(
= _input_fn(

= _build_keras_model()

# The result of the training should be saved in `fn_args.serving_model_dir`
# directory.
.save(fn_args.serving_model_dir, save_format='tf')

Scrivi una definizione di pipeline

Definiremo una funzione per creare una pipeline TFX. In aggiunta alla componente valutatore cui abbiamo parlato sopra, aggiungeremo un altro nodo denominato Resolver . Per verificare che un nuovo modello stia migliorando rispetto al modello precedente, dobbiamo confrontarlo con un modello pubblicato precedente, chiamato linea di base. ML metadati (MLMD) tiene traccia di tutti gli artefatti precedenti del gasdotto e Resolver può trovare quello che era l'ultimo modello benedetto - un modello superato Evaluator con successo - da MLMD utilizzando una classe strategia chiamata LatestBlessedModelStrategy .

import tensorflow_model_analysis as tfma

def _create_pipeline(pipeline_name: str, pipeline_root: str, data_root: str,
: str, serving_model_dir: str,
: str) -> tfx.dsl.Pipeline:
"""Creates a three component penguin pipeline with TFX."""
# Brings data into the pipeline.
= tfx.components.CsvExampleGen(input_base=data_root)

# Uses user-provided Python function that trains a model.
= tfx.components.Trainer(

# NEW: Get the latest blessed model for Evaluator.
= tfx.dsl.Resolver(

# NEW: Uses TFMA to compute evaluation statistics over features of a model and
#   perform quality validation of a candidate model (compared to a baseline).

= tfma.EvalConfig(
# An empty slice spec means the overall slice, i.e. the whole dataset.
# Calculate metrics for each penguin species.
={'value': 0.6}),
# Change threshold will be ignored if there is no
# baseline model resolved from MLMD (first run).
={'value': -1e-10}))
= tfx.components.Evaluator(

# Checks whether the model passed the validation steps and pushes the model
# to a file destination if check passed.
= tfx.components.Pusher(
=evaluator.outputs['blessing'], # Pass an evaluation result.

= [

# Following two components were added to the pipeline.


return tfx.dsl.Pipeline(

Abbiamo bisogno di fornire le seguenti informazioni al valutatore via eval_config :

  • Metriche aggiuntive da configurare (se si desidera più metriche di quelle definite nel modello).
  • Fette da configurare
  • Soglie di convalida del modello per verificare se la convalida deve essere inclusa

Perché SparseCategoricalAccuracy era già inclusa nel model.compile() chiamata, verrà automaticamente incluso nell'analisi. Quindi non aggiungiamo ulteriori metriche qui. SparseCategoricalAccuracy sarà usato per decidere se il modello è abbastanza buono, anche.

Calcoliamo le metriche per l'intero set di dati e per ogni specie di pinguino. SlicingSpec specifica come ci aggreghiamo le metriche dichiarati.

Ci sono due soglie che un nuovo modello dovrebbe superare, una è una soglia assoluta di 0,6 e l'altra è una soglia relativa che dovrebbe essere superiore al modello di base. Quando si esegue la pipeline per la prima volta, il change_threshold verrà ignorato e solo il value_threshold sarà controllata. Se si esegue la pipeline più di una volta, il Resolver troverà un modello della precedente esecuzione e sarà usato come modello di riferimento per il confronto.

Vedere Evaluator guida componente per ulteriori informazioni.

Esegui la pipeline

Useremo LocalDagRunner come nel precedente tutorial.

Quando la pipeline è stata completata, dovresti essere in grado di vedere qualcosa di simile a quanto segue:

INFO:absl:Blessing result True written to pipelines/penguin-tfma/Evaluator/blessing/4.

Oppure puoi anche controllare manualmente la directory di output in cui sono archiviati gli artefatti generati. Se si visita pipelines/penguin-tfma/Evaluator/blessing/ con un file broswer, si può vedere un file con un nome BLESSED o NOT_BLESSED a seconda del risultato della valutazione.

Se il risultato benedizione è False , Pusher si rifiuterà di spingere il modello al serving_model_dir , perché il modello non è abbastanza buono per essere utilizzato in produzione.

È possibile eseguire nuovamente la pipeline possibilmente con diverse configurazioni di valutazione. Anche se si esegue la pipeline con la stessa configurazione e set di dati, il modello addestrato potrebbe essere leggermente diverso a causa della casualità intrinseca del modello di formazione che può portare a un NOT_BLESSED modello.

Esaminare gli output della pipeline

È possibile utilizzare TFMA per esaminare e visualizzare il risultato della valutazione nell'elemento ModelEvaluation.

Ottieni il risultato dell'analisi dagli artefatti di output

È possibile utilizzare le API MLMD per individuare questi output in modo programmatico. In primo luogo, definiremo alcune funzioni di utilità per cercare gli artefatti di output che sono stati appena prodotti.

from ml_metadata.proto import metadata_store_pb2
# Non-public APIs, just for showcase.
from tfx.orchestration.portable.mlmd import execution_lib

# TODO(b/171447278): Move these functions into the TFX library.

def get_latest_artifacts(metadata, pipeline_name, component_id):
"""Output artifacts of the latest run of the component."""
'node', f'{pipeline_name}.{component_id}')
= max(executions,
=lambda e:e.last_update_time_since_epoch)
return execution_lib.get_artifacts_dict(metadata,,

Possiamo trovare le ultime esecuzione del Evaluator dei componenti e ottenere manufatti di uscita di esso.

# Non-public APIs, just for showcase.
from tfx.orchestration.metadata import Metadata
from tfx.types import standard_component_specs

= tfx.orchestration.metadata.sqlite_metadata_connection_config(

with Metadata(metadata_connection_config) as metadata_handler:
# Find output artifacts from MLMD.
= get_latest_artifacts(metadata_handler, PIPELINE_NAME,
= evaluator_output[standard_component_specs.EVALUATION_KEY][0]
INFO:absl:MetadataStore with DB connection initialized

Evaluator restituisce sempre un artefatto di valutazione, e possiamo visualizzarlo utilizzando la libreria tensorflow modello di analisi. Ad esempio, il codice seguente renderà le metriche di precisione per ogni specie di pinguino.

import tensorflow_model_analysis as tfma

= tfma.load_eval_result(eval_artifact.uri)
.view.render_slicing_metrics(eval_result, slicing_column='species')
SlicingMetricsViewer(config={'weightedExamplesColumn': 'example_count'}, data=[{'slice': 'species:0', 'metrics…

Se si sceglie 'sparse_categorical_accuracy' in Show elenco a discesa, è possibile vedere i valori di precisione per specie. Potresti voler aggiungere più sezioni e verificare se il tuo modello è adatto a tutte le distribuzioni e se c'è qualche possibile distorsione.

Prossimi passi

Per saperne di più sul modello di analisi a tensorflow modello di analisi biblioteca esercitazione .

È possibile trovare ulteriori risorse su

Si prega di consultare Capire TFX Pipelines per conoscere meglio i vari concetti in TFX.