Conozca lo último en aprendizaje automático, IA generativa y más en el Simposio WiML 2023.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

FixedUnigramCandidateSampler.Options

FixedUnigramCandidateSampler.Options estáticos de clase pública

Los atributos opcionales para FixedUnigramCandidateSampler

Métodos públicos

FixedUnigramCandidateSampler.Options	distorsión (distorsión Float)
FixedUnigramCandidateSampler.Options	numReservedIds (numReservedIds de largo)
FixedUnigramCandidateSampler.Options	numShards (numShards de largo)
FixedUnigramCandidateSampler.Options	semilla (semilla de larga duración)
FixedUnigramCandidateSampler.Options	seed2 (Long seed2)
FixedUnigramCandidateSampler.Options	fragmento (fragmento largo)
FixedUnigramCandidateSampler.Options	unigrams (List <Float> unigrams)
FixedUnigramCandidateSampler.Options	vocabFile (String vocabFile)

Métodos heredados

De la clase java.lang.Object

booleano	equals (Object arg0)
Clase final <?>	getClass ()
En t	hashCode ()
vacío final	notificar ()
vacío final	notifyAll ()
Cuerda	toString ()
vacío final	espera (tiempo arg0, arg1 int)
vacío final	espera (arg0 largo)
vacío final	wait ()

Métodos públicos

pública FixedUnigramCandidateSampler.Options distorsión (distorsión del flotador)

Parámetros

distorsión	La distorsión se utiliza para sesgar la distribución de probabilidad unigrama. Cada peso se eleva primero a la potencia de la distorsión antes de agregarlo a la distribución interna de unigramo. Como resultado, la distorsión = 1.0 proporciona un muestreo de unigramo regular (según lo definido por el archivo de vocabulario) y la distorsión = 0.0 proporciona una distribución uniforme.

públicas FixedUnigramCandidateSampler.Options numReservedIds (numReservedIds de largo)

Parámetros

numReservedIds	Opcionalmente, los usuarios pueden agregar algunos ID reservados en el rango [0, ..., num_reserved_ids). Un caso de uso es que se utiliza un token de palabra desconocida especial como ID 0. Estos ID tendrán una probabilidad de muestreo de 0.

públicas FixedUnigramCandidateSampler.Options numShards (numShards de largo)

Parámetros

numShards	Se puede utilizar un muestreador para muestrear de un subconjunto del rango original con el fin de acelerar todo el cálculo a través del paralelismo. Este parámetro (junto con 'fragmento') indica el número de particiones que se utilizan en el cálculo general.

pública FixedUnigramCandidateSampler.Options semilla (semilla de larga duración)

Parámetros

semilla	Si la semilla o semilla2 se establecen en un valor distinto de cero, el generador de números aleatorios es sembrado por la semilla dada. De lo contrario, es sembrado por una semilla aleatoria.

públicas FixedUnigramCandidateSampler.Options seed2 (Long seed2)

Parámetros

semilla2	Una segunda semilla para evitar la colisión de semillas.

pública FixedUnigramCandidateSampler.Options fragmento (fragmento largo)

Parámetros

casco	Se puede utilizar un muestreador para muestrear de un subconjunto del rango original con el fin de acelerar todo el cálculo a través del paralelismo. Este parámetro (junto con 'num_shards') indica el número de partición particular de una operación de muestreo, cuando se utiliza la partición.

públicas FixedUnigramCandidateSampler.Options unigrams (List <Float> unigrams)

Parámetros

unigramos	Una lista de recuentos o probabilidades de unigramo, uno por ID en orden secuencial. Se debe pasar exactamente uno de vocab_file y unigrams a esta operación.

pública FixedUnigramCandidateSampler.Options vocabFile (String vocabFile)

Parámetros

vocabFile	Cada línea válida en este archivo (que debe tener un formato similar a CSV) corresponde a una ID de palabra válida. Los ID están en orden secuencial, comenzando por num_reserved_ids. Se espera que la última entrada en cada línea sea un valor correspondiente al recuento o probabilidad relativa. Exactamente uno de vocab_file y unigrams debe pasarse a esta operación.

FixedUnigramCandidateSampler.Options Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Métodos públicos

Métodos heredados

Métodos públicos

pública FixedUnigramCandidateSampler.Options distorsión (distorsión del flotador)

Parámetros

públicas FixedUnigramCandidateSampler.Options numReservedIds (numReservedIds de largo)

Parámetros

públicas FixedUnigramCandidateSampler.Options numShards (numShards de largo)

Parámetros

pública FixedUnigramCandidateSampler.Options semilla (semilla de larga duración)

Parámetros

públicas FixedUnigramCandidateSampler.Options seed2 (Long seed2)

Parámetros

pública FixedUnigramCandidateSampler.Options fragmento (fragmento largo)

Parámetros

públicas FixedUnigramCandidateSampler.Options unigrams (List <Float> unigrams)

Parámetros

pública FixedUnigramCandidateSampler.Options vocabFile (String vocabFile)

Parámetros

FixedUnigramCandidateSampler.Options