Opcje umożliwiające skonfigurowanie potoku przetwarzania obrazu, który działa przed wnioskowaniem.
Interfejs API Vision Library zadań wykonuje wstępne przetwarzanie obrazu wejściowego w obszarze zainteresowania, tak aby pasował do wymagań modelu (np. pionowy 224x224 RGB) i wypełniał odpowiedni tensor wejściowy. Wykonuje się to (w tej kolejności):
- przycięcie bufora ramki do interesującego obszaru (który w większości przypadków obejmuje tylko cały obraz wejściowy),
- zmiana jego rozmiaru (z interpolacją dwuliniową, proporcje *nie* zachowane) do wymiarów tensora wejściowego modelu,
- konwertowanie go do przestrzeni kolorów tensora wejściowego (tj. RGB, które jest na razie jedyną obsługiwaną przestrzenią kolorów),
- obracanie go zgodnie z jego
ImageProcessingOptions.Orientation
, tak aby wnioskowanie było przeprowadzane na „pionowym” obrazie.
WAŻNE: w konsekwencji najpierw występującego kadrowania, podany obszar zainteresowania jest wyrażony w nieobróconym układzie współrzędnych odniesienia, czyli w [0, TensorImage.getWidth()) x [0, TensorImage.getHeight())
, które są wymiary podstawowych danych obrazu przed zastosowaniem jakiejkolwiek orientacji. Jeśli region wykracza poza te granice, metoda wnioskowania, taka jak ImageClassifier.classify(MlImage)
, zwróci błąd.
Klasy zagnieżdżone
klasa | ImageProcessingOptions.Builder | Konstruktor dla ImageProcessingOptions . | |
wyliczenie | Opcje przetwarzania obrazu.Orientacja | Typ orientacji zgodny ze specyfikacją EXIF. |
Konstruktorzy publiczni
Metody publiczne
statyczne ImageProcessingOptions.Builder | budowniczy () |
streszczenie ImageProcessingOptions.Orientacja | |
streszczenie Rekt | getRoi () |