Opções para configurar o pipeline de processamento de imagens, que opera antes da inferência.
A API Task Library Vision realiza o pré-processamento de imagem na imagem de entrada na região de interesse, para que ela atenda aos requisitos do modelo (por exemplo, 224x224 RGB vertical) e preencha o tensor de entrada correspondente. Isso é realizado por (nesta ordem):
- cortar o buffer de quadros para a região de interesse (que, na maioria dos casos, cobre apenas toda a imagem de entrada),
- redimensioná-lo (com interpolação bilinear, proporção *não* preservada) para as dimensões do tensor de entrada do modelo,
- convertendo-o para o espaço de cores do tensor de entrada (ou seja, RGB, que é o único espaço de cores suportado no momento),
- girando-o de acordo com seu
ImageProcessingOptions.Orientation
para que a inferência seja realizada em uma imagem "vertical".
IMPORTANTE: como consequência do corte ocorrer primeiro, a região de interesse fornecida é expressa no quadro não girado do sistema de coordenadas de referência, ou seja, em [0, TensorImage.getWidth()) x [0, TensorImage.getHeight())
, que são as dimensões dos dados de imagem subjacentes antes de qualquer orientação ser aplicada. Se a região estiver fora desses limites, o método de inferência, como ImageClassifier.classify(MlImage)
, retornará erro.
Classes aninhadas
aula | ImageProcessingOptions.Builder | Construtor para ImageProcessingOptions . | |
enumeração | ImageProcessingOptions.Orientation | Tipo de orientação que segue a especificação EXIF. |
Construtores Públicos
Métodos Públicos
ImageProcessingOptions.Builder estático | construtor () |
abstrato ImageProcessingOptions.Orientation | |
resumo abstrato | getRoi () |