Google Play 服务中的 TensorFlow Lite

TensorFlow Lite 可以在 Google Play 服务运行时中用于所有运行当前版本 Play 服务的 Android 设备。利用此运行时，您可以运行机器学习模型，无需将 TensorFlow Lite 库静态捆绑到您的应用中。

使用 Google Play 服务 API，您可以缩减应用的大小并从最新稳定版本的库中获得改进的性能。Google Play 服务中的 TensorFlow Lite 是在 Android 上使用 TensorFlow Lite 的推荐方式。

您可以通过快速入门开始使用 Play 服务运行时，它提供了实现示例应用的分步指南。如果您已经在应用中使用独立的 TensorFlow Lite，请参阅从独立的 TensorFlow Lite 迁移部分，以更新现有应用来使用 Play 服务运行时。有关 Google Play 服务的更多信息，请参阅 Google Play 服务网站。

使用 Play 服务运行时

Google Play 服务中的 TensorFlow Lite 可以通过 TensorFlow Lite Task API 和 TensorFlow Lite Interpreter API 获得。Task Library 为使用视觉、音频和文本数据的常见机器学习任务提供了优化的开箱即用模型接口。TensorFlow Lite Interpreter API 由 TensorFlow 运行时和支持库提供，为构建和运行机器学习模型提供了更通用的接口。

以下部分提供了有关如何在 Google Play 服务中实现 Interpreter API 和 Task Library API 的说明。虽然应用可以同时使用 Interpreter API 和 Task Library API，但大多数应用只应使用一组 API。

使用 Task Library API

TensorFlow Lite Task API 封装了 Interpreter API，并为使用视觉、音频和文本数据的常见机器学习任务提供了高级编程接口。如果您的应用需要支持的任务之一，您应该使用 Task API。

1. 添加项目依赖项

您的项目依赖项取决于您的机器学习用例。Task API 包含以下库：

视觉库：org.tensorflow:tensorflow-lite-task-vision-play-services
音频库：org.tensorflow:tensorflow-lite-task-audio-play-services
文本库：org.tensorflow:tensorflow-lite-task-text-play-services

将依赖项之一添加到您的应用项目代码中，以访问适用于 TensorFlow Lite 的 Play 服务 API。例如，要实现一个视觉任务，请使用以下代码：

dependencies {
...
    implementation 'org.tensorflow:tensorflow-lite-task-vision-play-services:0.4.2'
...
}

注意：TensorFlow Lite Task Audio 库版本 0.4.2 maven 仓库不完整。作为替代，将版本 0.4.2.1 用于此库：org.tensorflow:tensorflow-lite-task-audio-play-services:0.4.2.1。

2. 添加 TensorFlow Lite 的初始化

在使用 TensorFlow Lite API 之前，先初始化 Google Play 服务 API 的 TensorFlow Lite 组件。以下示例可以初始化视觉库：

Kotlin

init {
  TfLiteVision.initialize(context)
    }
  }

重要提示：确保在执行访问 TensorFlow Lite API 的代码之前完成 TfLite.initialize 任务。

提示：TensorFlow Lite 模块在从 Play 商店安装或更新应用时安装。您可以使用 Google Play 服务 API 中的 ModuleInstallClient 检查模块的可用性。有关检查模块可用性的更多信息，请参阅使用 ModuleInstallClient 确保 API 可用性。

3. 运行推断

初始化 TensorFlow Lite 组件后，调用 detect() 方法生成推断。detect() 方法中的确切代码因库和用例而异。以下是使用 TfLiteVision 库的简单目标检测用例：

Kotlin

fun detect(...) {
  if (!TfLiteVision.isInitialized()) {
    Log.e(TAG, "detect: TfLiteVision is not initialized yet")
    return
  }

  if (objectDetector == null) {
    setupObjectDetector()
  }

  ...

}

根据数据格式，您可能还需要在 detect() 方法中预处理和转换数据，然后再生成推断。例如，目标检测器的图像数据需要以下代码：

val imageProcessor = ImageProcessor.Builder().add(Rot90Op(-imageRotation / 90)).build()
val tensorImage = imageProcessor.process(TensorImage.fromBitmap(image))
val results = objectDetector?.detect(tensorImage)

使用 Interpreter API

Interpreter API 比 Task Library API 提供更多的控制和灵活性。如果 Task Library 不支持您的机器学习任务，或者如果您需要更通用的接口来构建和运行机器学习模型，应该使用 Interpreter API。

1. 添加项目依赖项

将以下依赖项添加到您的应用项目代码中，以访问适用于 TensorFlow Lite 的 Play 服务 API：

dependencies {
...
    // Tensorflow Lite dependencies for Google Play services
    implementation 'com.google.android.gms:play-services-tflite-java:16.0.1'
    // Optional: include Tensorflow Lite Support Library
    implementation 'com.google.android.gms:play-services-tflite-support:16.0.1'
...
}

2. 添加 TensorFlow Lite 的初始化

在使用 TensorFlow Lite API 之前，先初始化 Google Play 服务 API 的 TensorFlow Lite 组件：

Kotlin

val initializeTask: Task<Void> by lazy { TfLite.initialize(this) }

Java

Task<Void> initializeTask = TfLite.initialize(context);

注：请确保在执行访问 TensorFlow Lite API 的代码之前完成 TfLite.initialize 任务。使用 addOnSuccessListener() 方法，如下一部分所示。

3. 创建解释器并设置运行时选项

使用 InterpreterApi.create() 创建解释器，并通过调用 InterpreterApi.Options.setRuntime() 将其配置为使用 Google Play 服务运行时，如以下示例代码所示：

Kotlin

import org.tensorflow.lite.InterpreterApi
import org.tensorflow.lite.InterpreterApi.Options.TfLiteRuntime
...
private lateinit var interpreter: InterpreterApi
...
initializeTask.addOnSuccessListener {
  val interpreterOption =
    InterpreterApi.Options().setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY)
  interpreter = InterpreterApi.create(
    modelBuffer,
    interpreterOption
  )}
  .addOnFailureListener { e ->
    Log.e("Interpreter", "Cannot initialize interpreter", e)
  }

Java

import org.tensorflow.lite.InterpreterApi
import org.tensorflow.lite.InterpreterApi.Options.TfLiteRuntime
...
private InterpreterApi interpreter;
...
initializeTask.addOnSuccessListener(a -> {
    interpreter = InterpreterApi.create(modelBuffer,
      new InterpreterApi.Options().setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY));
  })
  .addOnFailureListener(e -> {
    Log.e("Interpreter", String.format("Cannot initialize interpreter: %s",
          e.getMessage()));
  });

您应该使用上面的实现，因为它能够避免阻塞 Android 界面线程。如果您需要更紧密地管理线程执行，可以添加一个 Tasks.await() 调用来创建解释器：

Kotlin

import androidx.lifecycle.lifecycleScope
...
lifecycleScope.launchWhenStarted { // uses coroutine
  initializeTask.await()
}

Java

@BackgroundThread
InterpreterApi initializeInterpreter() {
    Tasks.await(initializeTask);
    return InterpreterApi.create(...);
}

警告：请勿在前台界面线程上调用 .await()，因为这会中断界面元素的显示并产生不好的用户体验。

4. 运行推断

使用您创建的 interpreter 对象，调用 run() 方法来生成推断。

Kotlin

interpreter.run(inputBuffer, outputBuffer)

Java

interpreter.run(inputBuffer, outputBuffer);

硬件加速

TensorFlow Lite 允许您使用图形处理单元 (GPU) 等专用硬件处理器来加速模型的性能。您可以使用称为委托的硬件驱动程序来利用这些专用处理器。您可以在 Google Play 服务中将以下硬件加速委托与 TensorFlow Lite 一起使用：

GPU 委托（推荐） – 此委托通过 Google Play 服务提供并动态加载，就像 Play 服务版本的 Task API 和 Interpreter API 一样。
NNAPI 委托 – 此委托可作为您的 Android 开发项目中包含的库依赖项使用，并绑定到您的应用中。

有关使用 TensorFlow Lite 进行硬件加速的更多信息，请参阅 TensorFlow Lite 委托页面。

检查设备兼容性

并非所有设备都支持使用 TFLite 进行 GPU 硬件加速。为了减少错误和潜在的崩溃，请使用 TfLiteGpu.isGpuDelegateAvailable 方法检查设备与 GPU 委托是否兼容。

使用此方法确认设备与 GPU 是否兼容，并且在不支持 GPU 时使用 CPU 或 NNAPI 委托作为后备。

useGpuTask = TfLiteGpu.isGpuDelegateAvailable(context)

一旦拥有 useGpuTask 之类的变量，就可以使用它来确定设备是否使用 GPU 委托。下面的示例显示了如何使用 Task Library 和 Interpreter API 完成此操作。

使用 Task API

Kotlin

lateinit val optionsTask = useGpuTask.continueWith { task ->
  val baseOptionsBuilder = BaseOptions.builder()
  if (task.result) {
    baseOptionsBuilder.useGpu()
  }
 ObjectDetectorOptions.builder()
          .setBaseOptions(baseOptionsBuilder.build())
          .setMaxResults(1)
          .build()
}

Java

Task<ObjectDetectorOptions> optionsTask = useGpuTask.continueWith({ task ->
  BaseOptions baseOptionsBuilder = BaseOptions.builder();
  if (task.getResult()) {
    baseOptionsBuilder.useGpu();
  }
  return ObjectDetectorOptions.builder()
          .setBaseOptions(baseOptionsBuilder.build())
          .setMaxResults(1)
          .build()
});

使用 Interpreter API

Kotlin

val interpreterTask = useGpuTask.continueWith { task ->
  val interpreterOptions = InterpreterApi.Options()
      .setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY)
  if (task.result) {
      interpreterOptions.addDelegateFactory(GpuDelegateFactory())
  }
  InterpreterApi.create(FileUtil.loadMappedFile(context, MODEL_PATH), interpreterOptions)
}

Java

Task<InterpreterApi.Options> interpreterOptionsTask = useGpuTask.continueWith({ task ->
  InterpreterApi.Options options =
      new InterpreterApi.Options().setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY);
  if (task.getResult()) {
     options.addDelegateFactory(new GpuDelegateFactory());
  }
  return options;
});

GPU 与 Task Library API

要将 GPU 委托与 Task API 一起使用，请执行以下操作：

更新项目依赖项以使用来自 Play 服务的 GPU 委托：

implementation 'com.google.android.gms:play-services-tflite-gpu:16.1.0'

使用 setEnableGpuDelegateSupport 初始化 GPU委托。例如，您可以使用以下代码初始化 TfLiteVision 的 GPU 委托：

Kotlin

        TfLiteVision.initialize(context, TfLiteInitializationOptions.builder().setEnableGpuDelegateSupport(true).build())

Java

        TfLiteVision.initialize(context, TfLiteInitializationOptions.builder().setEnableGpuDelegateSupport(true).build());

使用 BaseOptions 启用 GPU 委托选项：

Kotlin

        val baseOptions = BaseOptions.builder().useGpu().build()

Java

        BaseOptions baseOptions = BaseOptions.builder().useGpu().build();

使用 .setBaseOptions 配置选项。例如，您可以使用以下代码在 ObjectDetector 中设置 GPU：

Kotlin

        val options =
                ObjectDetectorOptions.builder()
                    .setBaseOptions(baseOptions)
                    .setMaxResults(1)
                    .build()

Java

        ObjectDetectorOptions options =
                ObjectDetectorOptions.builder()
                    .setBaseOptions(baseOptions)
                    .setMaxResults(1)
                    .build();

GPU 与 Interpreter API

要将 GPU 委托与 Interpreter API 一起使用，请执行以下操作：

更新项目依赖项以使用来自 Play 服务的 GPU 委托：

implementation 'com.google.android.gms:play-services-tflite-gpu:16.1.0'

在 TFlite 初始化中启用 GPU 委托选项：

Kotlin

        TfLite.initialize(context,
              TfLiteInitializationOptions.builder()
               .setEnableGpuDelegateSupport(true)
               .build())

Java

        TfLite.initialize(context,
              TfLiteInitializationOptions.builder()
               .setEnableGpuDelegateSupport(true)
               .build());

通过调用 InterpreterApi.Options() 中的 addDelegateFactory() 在解释器选项中设置 GPU 委托以使用 DelegateFactory：

Kotlin

        val interpreterOption = InterpreterApi.Options()
             .setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY)
             .addDelegateFactory(GpuDelegateFactory())

Java

        Options interpreterOption = InterpreterApi.Options()
              .setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY)
              .addDelegateFactory(new GpuDelegateFactory());

从独立的 TensorFlow Lite 迁移

如果您计划将应用从独立 TensorFlow Lite 迁移到 Play 服务 API，请查看以下有关更新应用项目代码的附加指南：

请查看此页面的限制部分，以确保您的用例受支持。
在更新代码之前，请对模型进行性能和准确率检查，特别是如果您使用的是 2.1 之前版本的 TensorFlow Lite，这样您就有一个可以用来与新实现进行比较的基准。
如果您已迁移所有代码以使用适用于 TensorFlow Lite 的 Play 服务 API，则应从您的 build.gradle 文件中移除现有的 TensorFlow Lite runtime library 依赖项（带有 org.tensorflow:tensorflow-lite:* 的条目），以便缩减应用大小。
识别代码中创建 new Interpreter 对象的所有匹配项，并进行修改，使其使用 InterpreterApi.create() 调用。这个新的 API 为异步 API，这意味着在大多数情况下，它不是临时替代，当调用完成时，您必须注册一个侦听器。请参见第 3 步代码中的代码段。
将 import org.tensorflow.lite.InterpreterApi; 和 import org.tensorflow.lite.InterpreterApi.Options.TfLiteRuntime; 添加到任何使用 org.tensorflow.lite.Interpreter 或 org.tensorflow.lite.InterpreterApi 类的源文件中。
如果对 InterpreterApi.create() 的任何结果调用只有一个参数，请将 new InterpreterApi.Options() 追加到参数列表。
将 .setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY) 追加到对 InterpreterApi.create() 的任何调用的最后一个参数。
将 org.tensorflow.lite.Interpreter 类的其他匹配项替换为 org.tensorflow.lite.InterpreterApi。

如果想同时使用独立的 TensorFlow Lite 和 Play 服务 API，您必须使用 TensorFlow Lite 2.9 或更高版本。TensorFlow Lite 2.8 及之前的版本与 Play 服务 API 版本不兼容。

限制

Google Play 服务中的 TensorFlow Lite 存在以下限制：

对硬件加速委托的支持仅限于硬件加速部分中列出的委托。不支持其他加速委托。
不支持通过原生 API 访问 TensorFlow Lite。只有 TensorFlow Lite Java API 可以通过 Google Play 服务访问。
不支持实验性或过时的 TensorFlow Lite API，包括自定义运算。

支持和反馈

您可以通过 TensorFlow 问题跟踪器提供反馈并获得支持。请使用适用于 Google Play 服务中的 TensorFlow Lite 的议题模板报告议题和支持请求。

服务条款

使用 Google Play 服务中的 TensorFlow Lite 需遵守 Google API 服务条款。

隐私和数据收集

当您使用 Google Play 服务 API 中的 TensorFlow Lite 时，图像、视频、文本等输入数据的处理完全在设备端进行，而 Google Play 服务 API 中的 TensorFlow Lite 不会将这些数据发送到 Google 服务器。因此，您可以使用我们的 API 处理不应离开设备的数据。

Google Play 服务 API 中的 TensorFlow Lite 可能会不时联系 Google 服务器，以便接收错误修复、更新的模型和硬件加速器兼容性信息等内容。Google Play 服务 API 中的 TensorFlow Lite 还将有关应用中 API 的性能和利用率的指标发送给 Google。Google 使用这些指标数据来衡量性能，调试、维护和改进 API，并检测误用或滥用，有关详细信息，请参阅我们的隐私权政策。

您有责任根据适用法律的要求，将 Google 对 Google Play 服务 API 中的 TensorFlow Lite 指标数据的处理告知您应用的用户。

我们收集的数据包括：

设备信息（例如制造商、型号、操作系统版本和内部版本号）和可用的机器学习硬件加速器（GPU 和 DSP）。用于诊断和使用情况分析。
用于诊断和使用情况分析的设备标识符。
应用信息（软件包名称、应用版本)。用于诊断和使用情况分析。
API 配置（例如正在使用哪些委托）。用于诊断和使用情况分析。
事件类型（例如解释器创建、推断）。用于诊断和使用情况分析。
错误代码。用于诊断。
性能指标。用于诊断。

后续步骤

有关使用 TensorFlow Lite 在移动应用中实现机器学习的更多信息，请参阅 TensorFlow Lite 开发者指南。您可以在 TensorFlow Hub 上找到用于图像分类、目标检测和其他应用的其他 TensorFlow Lite 模型。