Convertir modelos de TensorFlow

Esta página describe cómo convertir un modelo TensorFlow en un modelo TensorFlow Lite (un formato FlatBuffer optimizado identificado por la extensión de archivo .tflite ) mediante el convertidor TensorFlow Lite.

Flujo de trabajo de conversión

El siguiente diagrama ilustra el flujo de trabajo de alto nivel para convertir su modelo:

Flujo de trabajo del convertidor TFLite

Figura 1. Flujo de trabajo del convertidor.

Puede convertir su modelo usando una de las siguientes opciones:

  1. Python API ( recomendado ): esto le permite integrar la conversión en su proceso de desarrollo, aplicar optimizaciones, agregar metadatos y muchas otras tareas que simplifican el proceso de conversión.
  2. Línea de comando : esto solo admite la conversión de modelo básico.

API de Python

Código auxiliar: para obtener más información sobre la API de conversión de TensorFlow Lite, ejecute print(help(tf.lite.TFLiteConverter)) .

Convierta un modelo de TensorFlow con tf.lite.TFLiteConverter . Un modelo de TensorFlow se almacena usando el formato de modelo guardado y se genera usando las API tf.keras.* de alto nivel (un modelo de Keras) o las API tf.* de bajo nivel (a partir de las cuales genera funciones concretas). Como resultado, tiene las siguientes tres opciones (los ejemplos se encuentran en las próximas secciones):

El siguiente ejemplo muestra cómo convertir un modelo guardado en un modelo TensorFlow Lite.

import tensorflow as tf

# Convert the model
converter = tf.lite.TFLiteConverter.from_saved_model(saved_model_dir) # path to the SavedModel directory
tflite_model = converter.convert()

# Save the model.
with open('model.tflite', 'wb') as f:
  f.write(tflite_model)

Convertir un modelo de Keras

El siguiente ejemplo muestra cómo convertir un modelo Keras en un modelo TensorFlow Lite.

import tensorflow as tf

# Create a model using high-level tf.keras.* APIs
model = tf.keras.models.Sequential([
    tf.keras.layers.Dense(units=1, input_shape=[1]),
    tf.keras.layers.Dense(units=16, activation='relu'),
    tf.keras.layers.Dense(units=1)
])
model.compile(optimizer='sgd', loss='mean_squared_error') # compile the model
model.fit(x=[-1, 0, 1], y=[-3, -1, 1], epochs=5) # train the model
# (to generate a SavedModel) tf.saved_model.save(model, "saved_model_keras_dir")

# Convert the model.
converter = tf.lite.TFLiteConverter.from_keras_model(model)
tflite_model = converter.convert()

# Save the model.
with open('model.tflite', 'wb') as f:
  f.write(tflite_model)

Convertir funciones concretas

El siguiente ejemplo muestra cómo convertir funciones concretas en un modelo de TensorFlow Lite.

import tensorflow as tf

# Create a model using low-level tf.* APIs
class Squared(tf.Module):
  @tf.function(input_signature=[tf.TensorSpec(shape=[None], dtype=tf.float32)])
  def __call__(self, x):
    return tf.square(x)
model = Squared()
# (ro run your model) result = Squared(5.0) # This prints "25.0"
# (to generate a SavedModel) tf.saved_model.save(model, "saved_model_tf_dir")
concrete_func = model.__call__.get_concrete_function()

# Convert the model.

converter = tf.lite.TFLiteConverter.from_concrete_functions([concrete_func],
                                                            model)
tflite_model = converter.convert()

# Save the model.
with open('model.tflite', 'wb') as f:
  f.write(tflite_model)

Otras características

  • Aplicar optimizaciones . Una optimización común utilizada es la cuantificación posterior al entrenamiento , que puede reducir aún más la latencia y el tamaño de su modelo con una pérdida mínima de precisión.

  • Agregue metadatos , lo que facilita la creación de código contenedor específico de la plataforma al implementar modelos en dispositivos.

Errores de conversión

Los siguientes son errores de conversión comunes y sus soluciones:

Herramienta de línea de comandos

Si instaló TensorFlow 2.x desde pip , use el comando tflite_convert . Para ver todas las banderas disponibles, use el siguiente comando:

$ tflite_convert --help

`--output_file`. Type: string. Full path of the output file.
`--saved_model_dir`. Type: string. Full path to the SavedModel directory.
`--keras_model_file`. Type: string. Full path to the Keras H5 model file.
`--enable_v1_converter`. Type: bool. (default False) Enables the converter and flags used in TF 1.x instead of TF 2.x.

You are required to provide the `--output_file` flag and either the `--saved_model_dir` or `--keras_model_file` flag.

Si tiene la fuente TensorFlow 2.x descargada y desea ejecutar el convertidor desde esa fuente sin compilar e instalar el paquete, puede reemplazar ' tflite_convert ' con ' bazel run tensorflow/lite/python:tflite_convert -- ' en el comando.

Convertir un modelo guardado

tflite_convert \
  --saved_model_dir=/tmp/mobilenet_saved_model \
  --output_file=/tmp/mobilenet.tflite

Convertir un modelo Keras H5

tflite_convert \
  --keras_model_file=/tmp/mobilenet_keras_model.h5 \
  --output_file=/tmp/mobilenet.tflite

Próximos pasos

Use el intérprete de TensorFlow Lite para ejecutar la inferencia en un dispositivo cliente (por ejemplo, móvil, integrado).