개발자는 TensorFlow Lite Metadata를 사용하여 래퍼 코드를 생성하여 Android에서 통합할 수 있습니다. 대부분의 개발자들에게 Android Studio ML Model Binding의 그래픽 인터페이스가 가장 사용하기 쉽습니다. 더 많은 맞춤화가 필요하거나 명령 줄 도구를 사용하는 경우 TensorFlow Lite Codegen도 사용할 수 있습니다.
Android Studio ML Model Binding {:#mlbinding} 사용
메타데이터로 강화된 TensorFlow Lite 모델의 경우 개발자는 Android Studio ML Model Binding을 사용하여 프로젝트를 위한 설정을 자동으로 구성하고 모델 메타데이터에 기초한 래퍼 클래스를 생성할 수 있습니다. 래퍼 코드를 사용하면 ByteBuffer
와 직접 상호 작용할 필요가 없습니다. 대신, 개발자는 Bitmap
및 Rect
와 같은 형식화된 객체를 통해 TensorFlow Lite 모델과 상호 작용할 수 있습니다.
참고: Android Studio 4.1 이상 필요
Import a TensorFlow Lite model in Android Studio
TFLite 모델을 사용하려는 모듈을 마우스 오른쪽 버튼으로 클릭하거나
,새로 만들기
>TensorFlow Lite 모델
을 클릭합니다.
TFLite 파일의 위치를 선택합니다. 도구가 ML 모델을 바인딩하고 모든 종속성은 Android 모듈의
파일에 자동으로 삽입하는 등 사용자를 대신하여 모듈의 종속성을 구성합니다.선택 사항: GPU 가속을 사용하려는 경우 TensorFlow GPU를 가져오기 위한 두 번째 확인란을 선택합니다.
을 클릭합니다.가져오기가 성공하면 다음 화면이 나타납니다. 모델 사용을 시작하려면 Kotlin 또는 Java를 선택하고
Sample Code
섹션 아래에 코드를 복사하여 붙여 넣습니다. Android Studio의ml
디렉터리 아래에 있는 TFLite 모델을 두 번 클릭하여 이 화면으로 돌아갈 수 있습니다.
Accelerating model inference
ML Model Binding은 개발자가 대리자 및 스레드 수를 사용하여 코드를 가속할 수 있는 방법을 제공합니다.
참고: TensorFlow Lite 인터프리터는 실행될 때와 동일한 스레드에서 생성되어야 합니다. 그렇지 않으면 "TfLiteGpuDelegate Invoke: GpuDelegate must run on the same thread where it was initialized."가 발생할 수 있습니다.
1 단계. 모듈 build.gradle
파일에 다음 종속성이 포함되어 있는지 확인합니다.
dependencies {
// TFLite GPU delegate 2.3.0 or above is required.
implementation 'org.tensorflow:tensorflow-lite-gpu:2.3.0'
2 단계. 여러 CPU 스레드를 사용하여 모델을 실행하지 않는 경우 기기에서 실행 중인 GPU가 TensorFlow GPU 대리자와 호환되는지 감지합니다.
import org.tensorflow.lite.gpu.CompatibilityList import org.tensorflow.lite.gpu.GpuDelegate val compatList = CompatibilityList() val options = if(compatList.isDelegateSupportedOnThisDevice) { // if the device has a supported GPU, add the GPU delegate Model.Options.Builder().setDevice(Model.Device.GPU).build() } else { // if the GPU is not supported, run on 4 threads Model.Options.Builder().setNumThreads(4).build() } // Initialize the model as usual feeding in the options object val myModel = MyModel.newInstance(context, options) // Run inference per sample code
import org.tensorflow.lite.support.model.Model import org.tensorflow.lite.gpu.CompatibilityList; import org.tensorflow.lite.gpu.GpuDelegate; // Initialize interpreter with GPU delegate Model.Options options; CompatibilityList compatList = CompatibilityList(); if(compatList.isDelegateSupportedOnThisDevice()){ // if the device has a supported GPU, add the GPU delegate options = Model.Options.Builder().setDevice(Model.Device.GPU).build(); } else { // if the GPU is not supported, run on 4 threads options = Model.Options.Builder().setNumThreads(4).build(); } MyModel myModel = new MyModel.newInstance(context, options); // Run inference per sample code
TensorFlow Lite 코드 생성기로 모델 인터페이스 생성
참고: TensorFlow Lite 래퍼 코드 생성기는 현재 Android만 지원합니다.
메타데이터로 강화된 TensorFlow Lite 모델의 경우, 개발자는 TensorFlow Lite Android 래퍼 코드 생성기를 사용하여 플랫폼별 래퍼 코드를 만들 수 있습니다. 래퍼 코드를 사용하면 ByteBuffer
와 직접 상호 작용할 필요가 없습니다. 대신, 개발자는 Bitmap
및 Rect
와 같은 형식화된 객체를 사용하여 TensorFlow Lite 모델과 상호 작용할 수 있습니다.
코드 생성기의 유용성은 TensorFlow Lite 모델의 메타데이터 항목이 얼마나 완전한지에 달려 있습니다. codegen 도구가 각 필드를 어떻게 구문 분석하는지 확인하려면 metadata_schema.fbs에서 관련 필드의 <Codegen usage>
섹션을 참조하십시오.
래퍼 코드 생성하기
단말기에 다음 도구를 설치해야 합니다.
pip install tflite-support
완료되면 다음 구문을 사용하여 코드 생성기를 사용할 수 있습니다.
tflite_codegen --model=./model_with_metadata/mobilenet_v1_0.75_160_quantized.tflite \
--package_name=org.tensorflow.lite.classify \
--model_class_name=MyClassifierModel \
결과 코드는 대상 디렉토리에 위치해 있습니다. Google Colab 또는 기타 원격 환경을 사용하는 경우, 결과를 zip 아카이브로 압축하여 Android Studio 프로젝트로 다운로드하는 것이 더 쉬울 수 있습니다.
# Zip up the generated code
!zip -r classify_wrapper.zip classify_wrapper/
# Download the archive
from google.colab import files
생성된 코드 사용하기
1단계: 생성된 코드 가져오기
필요한 경우 생성된 코드를 디렉토리 구조에 압축 해제합니다. 생성된 코드의 루트는 SRC_ROOT
로 간주합니다.
TensorFlow lite 모델을 사용하려는 Android Studio 프로젝트를 열고 생성된 모듈을 가져옵니다(File-> New-> Import Module-> SRC_ROOT
위의 예에서 가져온 디렉토리와 모듈은 classify_wrapper
라고 명명됩니다.
2단계: 앱의 build.gradle
파일 업데이트하기
생성된 라이브러리 모듈을 사용할 앱 모듈에서 다음을 수행합니다.
Under the android section, add the following:
aaptOptions {
noCompress "tflite"
참고: Android Gradle 플러그인 버전 4.1부터는 .tflite가 기본적으로 noCompress 목록에 추가되며 위의 aaptOptions는 더 이상 필요하지 않습니다.
종속성 섹션에 다음을 추가합니다.
implementation project(":classify_wrapper")
3단계: 모델 사용하기
// 1. Initialize the model
MyClassifierModel myImageClassifier = null;
try {
myImageClassifier = new MyClassifierModel(this);
} catch (IOException io){
// Error reading the model
if(null != myImageClassifier) {
// 2. Set the input with a Bitmap called inputBitmap
MyClassifierModel.Inputs inputs = myImageClassifier.createInputs();
// 3. Run the model
MyClassifierModel.Outputs outputs = myImageClassifier.run(inputs);
// 4. Retrieve the result
Map labeledProbability = outputs.getProbability();
모델 추론 가속하기
생성된 코드는 개발자가 대리자 및 스레드 수를 사용하여 코드를 가속할 수 있는 방법을 제공합니다. 모델 객체를 초기화할 때 다음 3개의 매개변수를 갖기 때문에 이들을 설정할 수 있습니다.
: Android 활동 또는 서비스의 컨텍스트- (선택 사항)
: GPUDelegate 또는 NNAPIDelegate와 같은 TFLite 가속 대리자 - (선택 사항)
: 모델을 실행하는 데 사용되는 스레드의 수 - 기본값 1
예를 들어, NNAPI 대리자와 최대 3개의 스레드를 사용하려면 다음과 같이 모델을 초기화할 수 있습니다.
try {
myImageClassifier = new MyClassifierModel(this, Model.Device.NNAPI, 3);
} catch (IOException io){
// Error reading the model
문제 해결
'java.io.FileNotFoundException: This file can not be opened as a file descriptor; it is probably compressed(이 파일을 파일 설명자로 열 수 없습니다. 압축되었을 수 있습니다.)' 오류가 발생하면 라이브러리 모듈을 사용할 앱 모듈의 android 섹션 아래에 다음 줄을 삽입합니다.
aaptOptions {
noCompress "tflite"
