Delegado de aceleração de GPU com API de intérprete Java/Kotlin

O uso de unidades de processamento gráfico (GPUs) para executar seus modelos de aprendizado de máquina (ML) pode melhorar drasticamente o desempenho e a experiência do usuário de seus aplicativos habilitados para ML. Em dispositivos Android, você pode ativar

delegado e uma das seguintes APIs:

  • API de intérprete Java/Kotlin – este guia
  • API da biblioteca de tarefas – guia
  • API nativa (C/C++) – guia

Esta página descreve como ativar a aceleração de GPU para modelos do TensorFlow Lite em aplicativos Android usando a API Interpreter. Para obter mais informações sobre como usar o delegado de GPU para TensorFlow Lite, incluindo práticas recomendadas e técnicas avançadas, consulte a página de delegados de GPU .

Use GPU com TensorFlow Lite com Google Play Services

A API do interpretador Java/Kotlin do TensorFlow Lite fornece um conjunto de APIs de uso geral para criar aplicativos de aprendizado de máquina. Esta seção descreve como usar o delegado do acelerador de GPU com essas APIs com TensorFlow Lite com Google Play Services.

TensorFlow Lite com Google Play Services é o caminho recomendado para usar o TensorFlow Lite no Android. Se seu aplicativo for direcionado a dispositivos que não executam o Google Play, consulte a seção GPU com API de intérprete e TensorFlow Lite independente .

Adicionar dependências do projeto

Para ativar o acesso ao delegado da GPU, adicione ao arquivo build.gradle do seu aplicativo:

dependencies {
    implementation ''
    implementation ''

Habilitar aceleração de GPU

Em seguida, inicialize o TensorFlow Lite com Google Play Services com suporte para GPU:


    val useGpuTask = TfLiteGpu.isGpuDelegateAvailable(context)

    val interpreterTask = useGpuTask.continueWith { useGpuTask ->


    Task useGpuTask = TfLiteGpu.isGpuDelegateAvailable(context);

    Task interpreterOptionsTask = useGpuTask.continueWith({ task ->

Você pode finalmente inicializar o interpretador passando um GpuDelegateFactory por meio de InterpreterApi.Options :


    val options = InterpreterApi.Options()

    val interpreter = InterpreterApi(model, options)

    // Run inference
    writeToInput(input), output)


    Options options = InterpreterApi.Options()
      .addDelegateFactory(new GpuDelegateFactory());

    Interpreter interpreter = new InterpreterApi(model, options);

    // Run inference
    writeToInput(input);, output);

O delegado de GPU também pode ser usado com vinculação de modelo de ML no Android Studio. Para obter mais informações, consulte Gerar interfaces de modelo usando metadados .

Use GPU com TensorFlow Lite independente

Se o seu aplicativo for direcionado a dispositivos que não executam o Google Play, é possível agrupar o delegado GPU ao seu aplicativo e usá-lo com a versão autônoma do TensorFlow Lite.

Adicionar dependências do projeto

Para habilitar o acesso ao delegado da GPU, adicione org.tensorflow:tensorflow-lite-gpu-delegate-plugin ao arquivo build.gradle do seu aplicativo:

dependencies {
    implementation 'org.tensorflow:tensorflow-lite'
    implementation 'org.tensorflow:tensorflow-lite-gpu-delegate-plugin'

Habilitar aceleração de GPU

Em seguida, execute o TensorFlow Lite na GPU com TfLiteDelegate . Em Java, você pode especificar o GpuDelegate por meio de Interpreter.Options .


      import org.tensorflow.lite.Interpreter
      import org.tensorflow.lite.gpu.CompatibilityList
      import org.tensorflow.lite.gpu.GpuDelegate

      val compatList = CompatibilityList()

      val options = Interpreter.Options().apply{
              // if the device has a supported GPU, add the GPU delegate
              val delegateOptions = compatList.bestOptionsForThisDevice
          } else {
              // if the GPU is not supported, run on 4 threads

      val interpreter = Interpreter(model, options)

      // Run inference
      writeToInput(input), output)


      import org.tensorflow.lite.Interpreter;
      import org.tensorflow.lite.gpu.CompatibilityList;
      import org.tensorflow.lite.gpu.GpuDelegate;

      // Initialize interpreter with GPU delegate
      Interpreter.Options options = new Interpreter.Options();
      CompatibilityList compatList = CompatibilityList();

          // if the device has a supported GPU, add the GPU delegate
          GpuDelegate.Options delegateOptions = compatList.getBestOptionsForThisDevice();
          GpuDelegate gpuDelegate = new GpuDelegate(delegateOptions);
      } else {
          // if the GPU is not supported, run on 4 threads

      Interpreter interpreter = new Interpreter(model, options);

      // Run inference
      writeToInput(input);, output);

Modelos quantizados

As bibliotecas delegadas de GPU do Android oferecem suporte a modelos quantizados por padrão. Você não precisa fazer nenhuma alteração no código para usar modelos quantizados com o delegado da GPU. A seção a seguir explica como desabilitar o suporte quantizado para fins de teste ou experimentais.

Desativar suporte a modelo quantizado

O código a seguir mostra como desabilitar o suporte para modelos quantizados.


GpuDelegate delegate = new GpuDelegate(new GpuDelegate.Options().setQuantizedModelsAllowed(false));

Interpreter.Options options = (new Interpreter.Options()).addDelegate(delegate);

Para obter mais informações sobre a execução de modelos quantizados com aceleração de GPU, consulte Visão geral do delegado de GPU .