flores

Descriptif :

Ensembles de données d'évaluation pour la traduction automatique à faibles ressources : népalais-anglais et cinghalais-anglais.

Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://github.com/facebookresearch/flores/
Code source : tfds.translate.Flores
Versions :
- 1.2.0 (par défaut) : aucune note de version.
Taille du téléchargement : 1.47 MiB
Mise en cache automatique ( documentation ): Oui
Figure ( tfds.show_examples ) : non pris en charge.
Citation :

@misc{guzmn2019new,
    title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
    author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
    year={2019},
    eprint={1902.01382},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

flores/neen (configuration par défaut)

Description de la configuration : ensemble de données de traduction de ne à en.
Taille du jeu de données : 1.89 MiB
Fractionnements :

Diviser	Exemples
`'test'`	2 835
`'validation'`	2 559

Structure des fonctionnalités :

Translation({
    'en': Text(shape=(), dtype=string),
    'ne': Text(shape=(), dtype=string),
})

Documentation des fonctionnalités :

Caractéristique	Classer	Dtype
	Traduction
fr	Texte	chaîne de caractères
ne	Texte	chaîne de caractères

Touches supervisées (Voir as_supervised doc ): ('ne', 'en')
Exemples ( tfds.as_dataframe ):

flores/siens

Description de la configuration : ensemble de données de traduction de si à en.
Taille du jeu de données : 2.05 MiB
Fractionnements :

Diviser	Exemples
`'test'`	2 766
`'validation'`	2 898

Structure des fonctionnalités :

Translation({
    'en': Text(shape=(), dtype=string),
    'si': Text(shape=(), dtype=string),
})

Documentation des fonctionnalités :

Caractéristique	Classer	Dtype
	Traduction
fr	Texte	chaîne de caractères
si	Texte	chaîne de caractères

Touches supervisées (Voir as_supervised doc ): ('si', 'en')
Exemples ( tfds.as_dataframe ):

flores Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

flores/neen (configuration par défaut)

flores/siens

flores