Skipgram

lezione finale pubblica Skipgram

Analizza un file di testo e crea una serie di esempi.

Classi annidate

classe Skipgram.Options Attributi opzionali per Skipgram

Metodi pubblici

Skipgram statico
create ( Scope scope, String filename, Long batchSize, Options ... options)
Metodo Factory per creare una classe che racchiude una nuova operazione Skipgram.
Uscita <Integer>
currentEpoch ()
Il numero dell'epoca corrente.
Uscita <Integer>
esempi ()
Un vettore di id di parola.
Uscita <Integer>
etichette ()
Un vettore di id di parola.
Skipgram.Options statico
minCount (Long minCount)
Skipgram.Options statico
Uscita <Lungo>
totalWordsProcessed ()
Il numero totale di parole elaborate finora.
Uscita <Integer>
vocabFreq ()
Frequenze di parole.
Output <String>
vocabWord ()
Un vettore di parole nel corpus.
Skipgram.Options statico
windowSize (Long windowSize)
Uscita <Lungo>
wordsPerEpoch ()
Numero di parole per epoca nel file di dati.

Metodi ereditati

Metodi pubblici

public static Skipgram create ( Scope scope, String filename, Long batchSize, Options ... options)

Metodo Factory per creare una classe che racchiude una nuova operazione Skipgram.

Parametri
scopo ambito attuale
nome del file Il nome del file di testo del corpus.
dimensione del lotto La dimensione del lotto prodotto.
opzioni trasporta valori di attributi opzionali
ritorna
  • una nuova istanza di Skipgram

output pubblico <Integer> currentEpoch ()

Il numero dell'epoca corrente.

public Output <Integer> esempi ()

Un vettore di id di parola.

public Output <Integer> etichette ()

Un vettore di id di parola.

public static Skipgram.Options minCount (Long minCount)

Parametri
minCount Il numero minimo di occorrenze di parole da includere nel vocabolario.

public static Skipgram.Options sottocampione (sottocampione Float)

Parametri
sottocampione Soglia per l'occorrenza della parola. Le parole che appaiono con una frequenza più alta verranno sottoposte a campionamento casuale. Impostare a 0 per disabilitare.

output pubblico <Long> totalWordsProcessed ()

Il numero totale di parole elaborate finora.

public Output <Integer> vocabFreq ()

Frequenze di parole. Ordinati in ordine non crescente.

output pubblico <String> vocabWord ()

Un vettore di parole nel corpus.

public static Skipgram.Options windowSize (Long windowSize)

Parametri
windowSize Il numero di parole da prevedere a sinistra ea destra dell'obiettivo.

public Output <Long> wordsPerEpoch ()

Numero di parole per epoca nel file di dati.