Esta página descreve como converter um modelo do TensorFlow em um modelo do TensorFlow Lite (um formato FlatBuffer otimizado identificado pela extensão de arquivo .tflite
) usando o conversor do TensorFlow Lite.
Fluxo de trabalho de conversão
O diagrama abaixo ilustra o fluxo de trabalho de alto nível para converter seu modelo:
Figura 1. Fluxo de trabalho do conversor.
Você pode converter seu modelo usando uma das seguintes opções:
- API Python ( recomendado ): Isso permite integrar a conversão em seu pipeline de desenvolvimento, aplicar otimizações, adicionar metadados e muitas outras tarefas que simplificam o processo de conversão.
- Linha de comando : Isso suporta apenas a conversão de modelo básico.
API Python
Código auxiliar: para saber mais sobre a API do conversor TensorFlow Lite, execute print(help(tf.lite.TFLiteConverter))
.
Converta um modelo do TensorFlow usando tf.lite.TFLiteConverter
. Um modelo do TensorFlow é armazenado usando o formato SavedModel e é gerado usando as APIs tf.keras.*
de alto nível (um modelo Keras) ou as APIs tf.*
de baixo nível (a partir das quais você gera funções concretas). Como resultado, você tem as três opções a seguir (os exemplos estão nas próximas seções):
-
tf.lite.TFLiteConverter.from_saved_model()
( recomendado ): Converte um SavedModel . -
tf.lite.TFLiteConverter.from_keras_model()
: Converte um modelo Keras . -
tf.lite.TFLiteConverter.from_concrete_functions()
: Converte funções concretas .
Converter um SavedModel (recomendado)
O exemplo a seguir mostra como converter um SavedModel em um modelo do TensorFlow Lite.
import tensorflow as tf
# Convert the model
converter = tf.lite.TFLiteConverter.from_saved_model(saved_model_dir) # path to the SavedModel directory
tflite_model = converter.convert()
# Save the model.
with open('model.tflite', 'wb') as f:
f.write(tflite_model)
Converter um modelo Keras
O exemplo a seguir mostra como converter um modelo Keras em um modelo TensorFlow Lite.
import tensorflow as tf
# Create a model using high-level tf.keras.* APIs
model = tf.keras.models.Sequential([
tf.keras.layers.Dense(units=1, input_shape=[1]),
tf.keras.layers.Dense(units=16, activation='relu'),
tf.keras.layers.Dense(units=1)
])
model.compile(optimizer='sgd', loss='mean_squared_error') # compile the model
model.fit(x=[-1, 0, 1], y=[-3, -1, 1], epochs=5) # train the model
# (to generate a SavedModel) tf.saved_model.save(model, "saved_model_keras_dir")
# Convert the model.
converter = tf.lite.TFLiteConverter.from_keras_model(model)
tflite_model = converter.convert()
# Save the model.
with open('model.tflite', 'wb') as f:
f.write(tflite_model)
Converter funções concretas
O exemplo a seguir mostra como converter funções concretas em um modelo do TensorFlow Lite.
import tensorflow as tf
# Create a model using low-level tf.* APIs
class Squared(tf.Module):
@tf.function(input_signature=[tf.TensorSpec(shape=[None], dtype=tf.float32)])
def __call__(self, x):
return tf.square(x)
model = Squared()
# (ro run your model) result = Squared(5.0) # This prints "25.0"
# (to generate a SavedModel) tf.saved_model.save(model, "saved_model_tf_dir")
concrete_func = model.__call__.get_concrete_function()
# Convert the model.
converter = tf.lite.TFLiteConverter.from_concrete_functions([concrete_func],
model)
tflite_model = converter.convert()
# Save the model.
with open('model.tflite', 'wb') as f:
f.write(tflite_model)
Outras características
Aplicar otimizações . Uma otimização comum usada é a quantização pós-treinamento , que pode reduzir ainda mais a latência e o tamanho do modelo com perda mínima de precisão.
Adicione metadados , o que facilita a criação de código wrapper específico da plataforma ao implantar modelos em dispositivos.
Erros de conversão
A seguir estão erros de conversão comuns e suas soluções:
Erro:
Some ops are not supported by the native TFLite runtime, you can enable TF kernels fallback using TF Select. See instructions: <a href="https://www.tensorflow.org/lite/guide/ops_select">https://www.tensorflow.org/lite/guide/ops_select</a> TF Select ops: ..., .., ...
Solução: O erro ocorre porque seu modelo possui operações TF que não possuem uma implementação TFLite correspondente. Você pode resolver isso usando o TF op no modelo TFLite (recomendado). Se você deseja gerar um modelo apenas com operações TFLite, você pode adicionar uma solicitação para a operação TFLite ausente na edição #21526 do Github (deixe um comentário se sua solicitação ainda não tiver sido mencionada) ou crie você mesmo a operação TFLite .
Erro:
.. is neither a custom op nor a flex op
Solução: Se este TF op for:
Suportado no TF: O erro ocorre porque o TF op está ausente da lista de permissões (uma lista exaustiva de TF ops suportados pelo TFLite). Você pode resolver isso da seguinte forma:
Não suportado no TF: O erro ocorre porque o TFLite não tem conhecimento do operador TF personalizado definido por você. Você pode resolver isso da seguinte forma:
- Crie a operação TF .
- Converta o modelo TF em um modelo TFLite .
- Crie o op TFLite e execute a inferência vinculando-o ao tempo de execução do TFLite.
Ferramenta de linha de comando
Se você instalou o TensorFlow 2.x de pip , use o comando tflite_convert
. Para visualizar todos os sinalizadores disponíveis, use o seguinte comando:
$ tflite_convert --help
`--output_file`. Type: string. Full path of the output file.
`--saved_model_dir`. Type: string. Full path to the SavedModel directory.
`--keras_model_file`. Type: string. Full path to the Keras H5 model file.
`--enable_v1_converter`. Type: bool. (default False) Enables the converter and flags used in TF 1.x instead of TF 2.x.
You are required to provide the `--output_file` flag and either the `--saved_model_dir` or `--keras_model_file` flag.
Se você tiver a fonte TensorFlow 2.x baixada e quiser executar o conversor dessa fonte sem compilar e instalar o pacote, você pode substituir ' tflite_convert
' por ' bazel run tensorflow/lite/python:tflite_convert --
' no comando.
Convertendo um SavedModel
tflite_convert \
--saved_model_dir=/tmp/mobilenet_saved_model \
--output_file=/tmp/mobilenet.tflite
Convertendo um modelo Keras H5
tflite_convert \
--keras_model_file=/tmp/mobilenet_keras_model.h5 \
--output_file=/tmp/mobilenet.tflite
Próximos passos
Use o interpretador do TensorFlow Lite para executar a inferência em um dispositivo cliente (por exemplo, móvel, incorporado).