Genera etiquetas para el muestreo de candidatos con una distribución de unigramo aprendida.
Consulte las explicaciones sobre el muestreo de candidatos y los formatos de datos en go / candidato-sampling.
Para cada lote, esta operación selecciona un único conjunto de etiquetas candidatas muestreadas.
Las ventajas de muestrear candidatos por lote son la simplicidad y la posibilidad de una multiplicación de matriz densa eficiente. La desventaja es que los candidatos incluidos en la muestra deben elegirse independientemente del contexto y de las verdaderas etiquetas.
Clases anidadas
clase | LearnedUnigramCandidateSampler.Options | Los atributos opcionales para LearnedUnigramCandidateSampler |
Constantes
Cuerda | OP_NAME | El nombre de esta operación, como lo conoce el motor central de TensorFlow |
Métodos públicos
estática LearnedUnigramCandidateSampler | crear ( Alcance alcance, operando < TInt64 > trueClasses, Long numTrue, Long numSampled, booleano exclusivo, Long RANGEMAX, Opciones ... Opciones) Método de fábrica para crear una clase que envuelva una nueva operación LearnedUnigramCandidateSampler. |
Salida < TInt64 > | sampledCandidates () Un vector de longitud num_sampled, en el que cada elemento es el ID de un candidato muestreado. |
Salida < TFloat32 > | sampledExpectedCount () Un vector de longitud num_sampled, para cada candidato muestreado que representa el número de veces que se espera que el candidato ocurra en un lote de candidatos muestreados. |
estáticas LearnedUnigramCandidateSampler.Options | semilla (semilla de larga duración) |
estáticas LearnedUnigramCandidateSampler.Options | seed2 (Long seed2) |
Salida < TFloat32 > | trueExpectedCount () Una matriz batch_size * num_true, que representa el número de veces que se espera que ocurra cada candidato en un lote de candidatos muestreados. |
Métodos heredados
Constantes
OP_NAME pública final static String
El nombre de esta operación, como lo conoce el motor central de TensorFlow
Métodos públicos
public static LearnedUnigramCandidateSampler crear ( Alcance alcance, operando < TInt64 > trueClasses, Long numTrue, Long numSampled, booleano exclusivo, Long RANGEMAX, Opciones ... Opciones)
Método de fábrica para crear una clase que envuelva una nueva operación LearnedUnigramCandidateSampler.
Parámetros
alcance | alcance actual |
---|---|
trueClasses | Una matriz batch_size * num_true, en la que cada fila contiene los ID de num_true target_classes en la etiqueta original correspondiente. |
numTrue | Número de etiquetas verdaderas por contexto. |
numSampled | Número de candidatos para muestrear aleatoriamente. |
único | Si único es verdadero, tomamos muestras con rechazo, de modo que todos los candidatos muestreados en un lote sean únicos. Esto requiere cierta aproximación para estimar las probabilidades de muestreo posteriores al rechazo. |
rangeMax | El muestreador muestreará números enteros del intervalo [0, range_max). |
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de LearnedUnigramCandidateSampler
pública de salida < TInt64 > sampledCandidates ()
Un vector de longitud num_sampled, en el que cada elemento es el ID de un candidato muestreado.
pública de salida < TFloat32 > sampledExpectedCount ()
Un vector de longitud num_sampled, para cada candidato muestreado que representa el número de veces que se espera que el candidato ocurra en un lote de candidatos muestreados. Si único = verdadero, entonces esta es una probabilidad.
public static LearnedUnigramCandidateSampler.Options semilla (semilla de larga duración)
Parámetros
semilla | Si la semilla o semilla2 se establecen en un valor distinto de cero, el generador de números aleatorios es sembrado por la semilla dada. De lo contrario, es sembrado por una semilla aleatoria. |
---|
public static LearnedUnigramCandidateSampler.Options seed2 (Long seed2)
Parámetros
semilla2 | Una segunda semilla para evitar la colisión de semillas. |
---|