LearnedUnigramCandidateSampler

LearnedUnigramCandidateSampler public final class

Genera etiquetas para el muestreo de candidatos con una distribución de unigramo aprendida.

Consulte las explicaciones sobre el muestreo de candidatos y los formatos de datos en go / candidato-sampling.

Para cada lote, esta operación selecciona un único conjunto de etiquetas candidatas muestreadas.

Las ventajas de muestrear candidatos por lote son la simplicidad y la posibilidad de una multiplicación de matriz densa eficiente. La desventaja es que los candidatos incluidos en la muestra deben elegirse independientemente del contexto y de las verdaderas etiquetas.

Clases anidadas

clase LearnedUnigramCandidateSampler.Options Los atributos opcionales para LearnedUnigramCandidateSampler

Constantes

Cuerda OP_NAME El nombre de esta operación, como lo conoce el motor central de TensorFlow

Métodos públicos

estática LearnedUnigramCandidateSampler
crear ( Alcance alcance, operando < TInt64 > trueClasses, Long numTrue, Long numSampled, booleano exclusivo, Long RANGEMAX, Opciones ... Opciones)
Método de fábrica para crear una clase que envuelva una nueva operación LearnedUnigramCandidateSampler.
Salida < TInt64 >
sampledCandidates ()
Un vector de longitud num_sampled, en el que cada elemento es el ID de un candidato muestreado.
Salida < TFloat32 >
sampledExpectedCount ()
Un vector de longitud num_sampled, para cada candidato muestreado que representa el número de veces que se espera que el candidato ocurra en un lote de candidatos muestreados.
estáticas LearnedUnigramCandidateSampler.Options
semilla (semilla de larga duración)
estáticas LearnedUnigramCandidateSampler.Options
seed2 (Long seed2)
Salida < TFloat32 >
trueExpectedCount ()
Una matriz batch_size * num_true, que representa el número de veces que se espera que ocurra cada candidato en un lote de candidatos muestreados.

Métodos heredados

Constantes

OP_NAME pública final static String

El nombre de esta operación, como lo conoce el motor central de TensorFlow

Valor constante: "LearnedUnigramCandidateSampler"

Métodos públicos

public static LearnedUnigramCandidateSampler crear ( Alcance alcance, operando < TInt64 > trueClasses, Long numTrue, Long numSampled, booleano exclusivo, Long RANGEMAX, Opciones ... Opciones)

Método de fábrica para crear una clase que envuelva una nueva operación LearnedUnigramCandidateSampler.

Parámetros
alcance alcance actual
trueClasses Una matriz batch_size * num_true, en la que cada fila contiene los ID de num_true target_classes en la etiqueta original correspondiente.
numTrue Número de etiquetas verdaderas por contexto.
numSampled Número de candidatos para muestrear aleatoriamente.
único Si único es verdadero, tomamos muestras con rechazo, de modo que todos los candidatos muestreados en un lote sean únicos. Esto requiere cierta aproximación para estimar las probabilidades de muestreo posteriores al rechazo.
rangeMax El muestreador muestreará números enteros del intervalo [0, range_max).
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de LearnedUnigramCandidateSampler

pública de salida < TInt64 > sampledCandidates ()

Un vector de longitud num_sampled, en el que cada elemento es el ID de un candidato muestreado.

pública de salida < TFloat32 > sampledExpectedCount ()

Un vector de longitud num_sampled, para cada candidato muestreado que representa el número de veces que se espera que el candidato ocurra en un lote de candidatos muestreados. Si único = verdadero, entonces esta es una probabilidad.

public static LearnedUnigramCandidateSampler.Options semilla (semilla de larga duración)

Parámetros
semilla Si la semilla o semilla2 se establecen en un valor distinto de cero, el generador de números aleatorios es sembrado por la semilla dada. De lo contrario, es sembrado por una semilla aleatoria.

public static LearnedUnigramCandidateSampler.Options seed2 (Long seed2)

Parámetros
semilla2 Una segunda semilla para evitar la colisión de semillas.

pública de salida < TFloat32 > trueExpectedCount ()

Una matriz batch_size * num_true, que representa el número de veces que se espera que ocurra cada candidato en un lote de candidatos muestreados. Si único = verdadero, entonces esta es una probabilidad.