เอกสารนี้อธิบายวิธีฝึกโมเดลและเรียกใช้การอนุมานโดยใช้ไมโครคอนโทรลเลอร์
ตัวอย่างสวัสดีชาวโลก
ตัวอย่างของ Hello World ได้รับการออกแบบมาเพื่อสาธิตพื้นฐานที่แท้จริงของการใช้ TensorFlow Lite สำหรับไมโครคอนโทรลเลอร์ เราฝึกและรันแบบจำลองที่จำลองฟังก์ชันไซน์ กล่าวคือ ใช้ตัวเลขตัวเดียวเป็นอินพุต และส่งออกค่า ไซน์ ของตัวเลข เมื่อนำไปใช้กับไมโครคอนโทรลเลอร์ การคาดการณ์จะใช้เพื่อกะพริบไฟ LED หรือควบคุมภาพเคลื่อนไหว
เวิร์กโฟลว์ตั้งแต่ต้นทางถึงปลายทางเกี่ยวข้องกับขั้นตอนต่อไปนี้:
- ฝึกฝนโมเดล (ใน Python): ไฟล์ Python เพื่อฝึกฝน แปลง และปรับแต่งโมเดลสำหรับการใช้งานบนอุปกรณ์
- เรียกใช้การอนุมาน (ใน C++ 17): การทดสอบหน่วยแบบ end-to-end ที่รันการอนุมานในโมเดลโดยใช้ ไลบรารี C++
รับอุปกรณ์ที่รองรับ
แอปพลิเคชันตัวอย่างที่เราจะใช้ได้รับการทดสอบบนอุปกรณ์ต่อไปนี้:
- Arduino Nano 33 BLE Sense (ใช้ Arduino IDE)
- SparkFun Edge (สร้างโดยตรงจากแหล่งที่มา)
- ชุดค้นพบ STM32F746 (ใช้ Mbed)
- Adafruit EdgeBadge (ใช้ Arduino IDE)
- Adafruit TensorFlow Lite สำหรับชุดไมโครคอนโทรลเลอร์ (โดยใช้ Arduino IDE)
- Adafruit Circuit Playground Bluefruit (ใช้ Arduino IDE)
- Espressif ESP32-DevKitC (ใช้ ESP IDF)
- Espressif ESP-EYE (ใช้ ESP IDF)
เรียนรู้เพิ่มเติมเกี่ยวกับแพลตฟอร์มที่รองรับใน TensorFlow Lite สำหรับไมโครคอนโทรลเลอร์
ฝึกโมเดล
ใช้ train.py สำหรับการฝึกอบรมโมเดล Hello World เพื่อการจดจำคลื่นไซน์
เรียกใช้: bazel build tensorflow/lite/micro/examples/hello_world:train
bazel-bin/tensorflow/lite/micro/examples/hello_world/train --save_tf_model --save_dir=/tmp/model_created/
เรียกใช้การอนุมาน
หากต้องการรันโมเดลบนอุปกรณ์ของคุณ เราจะดำเนินการตามคำแนะนำใน README.md
:
ส่วนต่อไปนี้จะอธิบายเกี่ยวกับตัวอย่าง evaluate_test.cc
ซึ่งเป็นการทดสอบหน่วย ซึ่งสาธิตวิธีการเรียกใช้การอนุมานโดยใช้ TensorFlow Lite สำหรับไมโครคอนโทรลเลอร์ โดยจะโหลดโมเดลและรันการอนุมานหลายครั้ง
1. รวมส่วนหัวของไลบรารี
หากต้องการใช้ไลบรารี TensorFlow Lite สำหรับไมโครคอนโทรลเลอร์ เราต้องมีไฟล์ส่วนหัวต่อไปนี้:
#include "tensorflow/lite/micro/micro_mutable_op_resolver.h"
#include "tensorflow/lite/micro/micro_error_reporter.h"
#include "tensorflow/lite/micro/micro_interpreter.h"
#include "tensorflow/lite/schema/schema_generated.h"
#include "tensorflow/lite/version.h"
-
micro_mutable_op_resolver.h
จัดเตรียมการดำเนินการที่ล่ามใช้เพื่อรันโมเดล -
micro_error_reporter.h
ส่งออกข้อมูลการดีบัก -
micro_interpreter.h
มีโค้ดสำหรับโหลดและรันโมเดล -
schema_generated.h
มีสคีมาสำหรับรูปแบบไฟล์โมเดล TensorFlow LiteFlatBuffer
-
version.h
ให้ข้อมูลการกำหนดเวอร์ชันสำหรับสคีมา TensorFlow Lite
2. รวมส่วนหัวของโมเดลด้วย
ตัวแปล TensorFlow Lite สำหรับไมโครคอนโทรลเลอร์คาดว่าจะระบุโมเดลเป็นอาร์เรย์ C++ โมเดลถูกกำหนดไว้ในไฟล์ model.h
และ model.cc
ส่วนหัวจะรวมอยู่ในบรรทัดต่อไปนี้:
#include "tensorflow/lite/micro/examples/hello_world/model.h"
3. รวมส่วนหัวกรอบการทดสอบหน่วย
ในการสร้างการทดสอบหน่วย เราได้รวมเฟรมเวิร์กการทดสอบหน่วย TensorFlow Lite สำหรับไมโครคอนโทรลเลอร์ไว้โดยรวมบรรทัดต่อไปนี้:
#include "tensorflow/lite/micro/testing/micro_test.h"
การทดสอบถูกกำหนดโดยใช้มาโครต่อไปนี้:
TF_LITE_MICRO_TESTS_BEGIN
TF_LITE_MICRO_TEST(LoadModelAndPerformInference) {
. // add code here
.
}
TF_LITE_MICRO_TESTS_END
ตอนนี้เราจะพูดถึงโค้ดที่รวมอยู่ในมาโครด้านบน
4. ตั้งค่าการบันทึก
ในการตั้งค่าการบันทึก ตัวชี้ tflite::ErrorReporter
จะถูกสร้างขึ้นโดยใช้ตัวชี้ไปยังอินสแตนซ์ tflite::MicroErrorReporter
:
tflite::MicroErrorReporter micro_error_reporter;
tflite::ErrorReporter* error_reporter = µ_error_reporter;
ตัวแปรนี้จะถูกส่งผ่านไปยังล่าม ซึ่งช่วยให้สามารถเขียนบันทึกได้ เนื่องจากไมโครคอนโทรลเลอร์มักจะมีกลไกที่หลากหลายในการบันทึก การใช้งาน tflite::MicroErrorReporter
จึงได้รับการออกแบบให้ปรับแต่งให้เหมาะกับอุปกรณ์ของคุณโดยเฉพาะ
5. โหลดโมเดล
ในโค้ดต่อไปนี้ โมเดลจะถูกสร้างอินสแตนซ์โดยใช้ข้อมูลจากอาร์เรย์ char
g_model
ซึ่งได้รับการประกาศใน model.h
จากนั้นเราจะตรวจสอบโมเดลเพื่อให้แน่ใจว่าเวอร์ชันสคีมาเข้ากันได้กับเวอร์ชันที่เราใช้:
const tflite::Model* model = ::tflite::GetModel(g_model);
if (model->version() != TFLITE_SCHEMA_VERSION) {
TF_LITE_REPORT_ERROR(error_reporter,
"Model provided is schema version %d not equal "
"to supported version %d.\n",
model->version(), TFLITE_SCHEMA_VERSION);
}
6. สร้างอินสแตนซ์ตัวแก้ไขการดำเนินการ
มีการประกาศอินสแตนซ์ MicroMutableOpResolver
ล่ามจะใช้สิ่งนี้เพื่อลงทะเบียนและเข้าถึงการดำเนินการที่โมเดลใช้:
using HelloWorldOpResolver = tflite::MicroMutableOpResolver<1>;
TfLiteStatus RegisterOps(HelloWorldOpResolver& op_resolver) {
TF_LITE_ENSURE_STATUS(op_resolver.AddFullyConnected());
return kTfLiteOk;
MicroMutableOpResolver
ต้องใช้พารามิเตอร์เทมเพลตที่ระบุจำนวน ops ที่จะลงทะเบียน ฟังก์ชัน RegisterOps
จะลงทะเบียนการดำเนินการกับตัวแก้ไข
HelloWorldOpResolver op_resolver;
TF_LITE_ENSURE_STATUS(RegisterOps(op_resolver));
7. จัดสรรหน่วยความจำ
เราจำเป็นต้องจัดสรรหน่วยความจำจำนวนหนึ่งล่วงหน้าสำหรับอินพุต เอาต์พุต และอาร์เรย์ระดับกลาง สิ่งนี้มีให้เป็นอาร์เรย์ uint8_t
ขนาด tensor_arena_size
:
const int tensor_arena_size = 2 * 1024;
uint8_t tensor_arena[tensor_arena_size];
ขนาดที่ต้องการจะขึ้นอยู่กับรุ่นที่คุณใช้ และอาจต้องพิจารณาจากการทดลอง
8. สร้างอินสแตนซ์ล่าม
เราสร้างอินสแตนซ์ tflite::MicroInterpreter
โดยส่งผ่านตัวแปรที่สร้างไว้ก่อนหน้านี้:
tflite::MicroInterpreter interpreter(model, resolver, tensor_arena,
tensor_arena_size, error_reporter);
9. จัดสรรเทนเซอร์
เราบอกให้ล่ามจัดสรรหน่วยความจำจาก tensor_arena
สำหรับเทนเซอร์ของโมเดล:
interpreter.AllocateTensors();
10. ตรวจสอบรูปร่างอินพุต
อินสแตนซ์ MicroInterpreter
สามารถให้ตัวชี้แก่เราไปยังอินพุตเทนเซอร์ของโมเดลได้โดยการเรียก .input(0)
โดยที่ 0
แสดงถึงเทนเซอร์อินพุตตัวแรก (และเท่านั้น):
// Obtain a pointer to the model's input tensor
TfLiteTensor* input = interpreter.input(0);
จากนั้นเราจะตรวจสอบเทนเซอร์นี้เพื่อยืนยันว่ารูปร่างและประเภทของเซ็นเซอร์เป็นไปตามที่เราคาดหวัง:
// Make sure the input has the properties we expect
TF_LITE_MICRO_EXPECT_NE(nullptr, input);
// The property "dims" tells us the tensor's shape. It has one element for
// each dimension. Our input is a 2D tensor containing 1 element, so "dims"
// should have size 2.
TF_LITE_MICRO_EXPECT_EQ(2, input->dims->size);
// The value of each element gives the length of the corresponding tensor.
// We should expect two single element tensors (one is contained within the
// other).
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[0]);
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[1]);
// The input is a 32 bit floating point value
TF_LITE_MICRO_EXPECT_EQ(kTfLiteFloat32, input->type);
ค่าแจงนับ kTfLiteFloat32
เป็นการอ้างอิงถึงประเภทข้อมูล TensorFlow Lite ประเภทใดประเภทหนึ่ง และกำหนดไว้ใน common.h
11. ระบุค่าอินพุต
เพื่อจัดเตรียมอินพุตให้กับโมเดล เราได้ตั้งค่าเนื้อหาของเทนเซอร์อินพุตดังนี้:
input->data.f[0] = 0.;
ในกรณีนี้ เราป้อนค่าจุดลอยตัวที่แสดงถึง 0
12. รันโมเดล
ในการรันโมเดล เราสามารถเรียก Invoke()
บนอินสแตนซ์ tflite::MicroInterpreter
ของเราได้:
TfLiteStatus invoke_status = interpreter.Invoke();
if (invoke_status != kTfLiteOk) {
TF_LITE_REPORT_ERROR(error_reporter, "Invoke failed\n");
}
เราสามารถตรวจสอบค่าที่ส่งคืนเป็น TfLiteStatus
เพื่อตรวจสอบว่าการรันสำเร็จหรือไม่ ค่าที่เป็นไปได้ของ TfLiteStatus
ที่กำหนดใน common.h
คือ kTfLiteOk
และ kTfLiteError
รหัสต่อไปนี้ยืนยันว่าค่าคือ kTfLiteOk
หมายความว่าการอนุมานถูกรันสำเร็จ
TF_LITE_MICRO_EXPECT_EQ(kTfLiteOk, invoke_status);
13. รับผลลัพธ์
สามารถรับเอาท์พุตเทนเซอร์ของโมเดลได้โดยการเรียก output(0)
บน tflite::MicroInterpreter
โดยที่ 0
แสดงถึงเทนเซอร์เอาท์พุตตัวแรก (และเท่านั้น)
ในตัวอย่าง ผลลัพธ์ของโมเดลคือค่าจุดลอยตัวเดียวที่อยู่ภายในเมตริกซ์ 2 มิติ:
TfLiteTensor* output = interpreter.output(0);
TF_LITE_MICRO_EXPECT_EQ(2, output->dims->size);
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[0]);
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[1]);
TF_LITE_MICRO_EXPECT_EQ(kTfLiteFloat32, output->type);
เราสามารถอ่านค่าได้โดยตรงจากเอาท์พุตเทนเซอร์และยืนยันว่าเป็นสิ่งที่เราคาดหวัง:
// Obtain the output value from the tensor
float value = output->data.f[0];
// Check that the output value is within 0.05 of the expected value
TF_LITE_MICRO_EXPECT_NEAR(0., value, 0.05);
14. เรียกใช้การอนุมานอีกครั้ง
ส่วนที่เหลือของโค้ดจะเรียกใช้การอนุมานอีกหลายครั้ง ในแต่ละกรณี เรากำหนดค่าให้กับเทนเซอร์อินพุต เรียกใช้ล่าม และอ่านผลลัพธ์จากเทนเซอร์เอาท์พุต:
input->data.f[0] = 1.;
interpreter.Invoke();
value = output->data.f[0];
TF_LITE_MICRO_EXPECT_NEAR(0.841, value, 0.05);
input->data.f[0] = 3.;
interpreter.Invoke();
value = output->data.f[0];
TF_LITE_MICRO_EXPECT_NEAR(0.141, value, 0.05);
input->data.f[0] = 5.;
interpreter.Invoke();
value = output->data.f[0];
TF_LITE_MICRO_EXPECT_NEAR(-0.959, value, 0.05);