Sous-classes directes connues |
Options de délégation.
Classes imbriquées
énumération | GpuDelegateFactory.Options.GpuBackend | Quel backend GPU sélectionner. |
Constantes
int | INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER | Le délégué ne sera utilisé qu'une seule fois, par conséquent, le temps d'amorçage/d'initialisation doit être pris en compte. |
int | INFERENCE_PREFERENCE_SUSTAINED_SPEED | Préférez maximiser le débit. |
Constructeurs Publics
Options () |
Méthodes publiques
booléen | |
GpuDelegateFactory.Options.GpuBackend | |
int | |
Chaîne | |
Chaîne | |
booléen | |
GpuDelegateFactory.Options | |
GpuDelegateFactory.Options | setInferencePreference (préférence int) Définit la préférence d’inférence pour les compromis précision/compilation/exécution. |
GpuDelegateFactory.Options | setPrecisionLossAllowed (précision booléenneLossAllowed) Définit si la perte de précision est autorisée. |
GpuDelegateFactory.Options | setQuantizedModelsAllowed (booléen quantizedModelsAllowed) Permet d'exécuter des modèles quantifiés avec le délégué. |
GpuDelegateFactory.Options | setSerializationParams ( String serializationDir, String modelToken) Active la sérialisation sur le délégué. |
Méthodes héritées
Constantes
public statique final int INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER
Le délégué ne sera utilisé qu'une seule fois, par conséquent, le temps d'amorçage/d'initialisation doit être pris en compte.
public statique final int INFERENCE_PREFERENCE_SUSTAINED_SPEED
Préférez maximiser le débit. Le même délégué sera utilisé à plusieurs reprises sur plusieurs entrées.
Constructeurs Publics
Options publiques ()
Méthodes publiques
public booléen areQuantizedModelsAllowed ()
public int getInferencePreference ()
public booléen isPrecisionLossAllowed ()
public GpuDelegateFactory.Options setForceBackend ( GpuDelegateFactory.Options.GpuBackend forceBackend)
Définit le backend GPU.
Paramètres
forceBackend |
---|
public GpuDelegateFactory.Options setInferencePreference (int préférence)
Définit la préférence d’inférence pour les compromis précision/compilation/exécution.
Paramètres
préférence | L'un des `INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER` (par défaut), `INFERENCE_PREFERENCE_SUSTAINED_SPEED`. |
---|
public GpuDelegateFactory.Options setPrecisionLossAllowed (booléen PrecisionLossAllowed)
Définit si la perte de précision est autorisée.
Paramètres
précisionPerteAutorisée | Lorsqu'il est « vrai » (par défaut), le GPU peut quantifier les tenseurs, les valeurs abaissées et les traiter dans le FP16. Lorsque « faux », les calculs sont effectués en virgule flottante 32 bits. |
---|
public GpuDelegateFactory.Options setQuantizedModelsAllowed (booléen quantizedModelsAllowed)
Permet d'exécuter des modèles quantifiés avec le délégué.
AVERTISSEMENT : Il s'agit d'une API expérimentale et susceptible d'être modifiée.
Paramètres
quantizedModèlesAutorisés | Lorsque true (par défaut), le GPU peut exécuter des modèles quantifiés. |
---|
public GpuDelegateFactory.Options setSerializationParams ( String serializationDir, String modelToken)
Active la sérialisation sur le délégué. Notez que serializationDir
et modelToken
non nuls sont requis pour la sérialisation.
AVERTISSEMENT : Il s'agit d'une API expérimentale et susceptible d'être modifiée.
Paramètres
sérialisationDir | Le répertoire à utiliser pour stocker les données. L'appelant est responsable de s'assurer que le modèle n'est pas stocké dans un répertoire public. Il est recommandé d'utiliser Context.getCodeCacheDir() pour fournir un emplacement privé pour l'application sur Android. |
---|---|
modèleJeton | Le jeton à utiliser pour identifier le modèle. L’appelant est responsable de s’assurer que le jeton est unique par rapport au graphique et aux données du modèle. |