mlqa

Descriptif :

MLQA (Multilingual Question Answering Dataset) est un ensemble de données de référence pour évaluer les performances de réponse aux questions multilingues. Le jeu de données se compose de 7 langues : arabe, allemand, espagnol, anglais, hindi, vietnamien, chinois.

Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://github.com/facebookresearch/MLQA
Code source : tfds.datasets.mlqa.Builder
Versions :
- 1.0.0 (par défaut) : aucune note de version.
Taille du téléchargement : 72.21 MiB
Mise en cache automatique ( documentation ): Oui
Structure des fonctionnalités :

FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'context': Text(shape=(), dtype=string),
    'id': string,
    'question': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})

Documentation des fonctionnalités :

Fonctionnalité	Classe	Dtype
	FonctionnalitésDict
réponses	Séquence
réponses/answer_start	Tenseur	int32
réponses/texte	Texte	chaîne
contexte	Texte	chaîne
identifiant	Tenseur	chaîne
question	Texte	chaîne
titre	Texte	chaîne

Clés supervisées (Voir as_supervised doc ): None
Figure ( tfds.show_examples ) : non pris en charge.
Citation :

@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa/ar (configuration par défaut)

Description de la configuration : MLQA 'ar' dev et test splits.
Taille du jeu de données : 9.28 MiB
Fractionnements :

Diviser	Exemples
`'test'`	5 335
`'validation'`	517

Exemples ( tfds.as_dataframe ):

mlqa/de

Description de la configuration : MLQA 'de' dev et test splits.
Taille du jeu de données : 5.06 MiB
Fractionnements :

Diviser	Exemples
`'test'`	4 517
`'validation'`	512

Exemples ( tfds.as_dataframe ):

mlqa/fr

Description de la configuration : MLQA 'en' dev et test splits.
Taille du jeu de données : 15.72 MiB
Fractionnements :

Diviser	Exemples
`'test'`	11 590
`'validation'`	1 148

Exemples ( tfds.as_dataframe ):

mlqa/es

Description de la configuration : MLQA 'es' dev et test splits.
Taille du jeu de données : 5.09 MiB
Fractionnements :

Diviser	Exemples
`'test'`	5 253
`'validation'`	500

Exemples ( tfds.as_dataframe ):

mlqa/salut

Description de la configuration : MLQA 'hi' dev et test splits.
Taille du jeu de données : 12.83 MiB
Fractionnements :

Diviser	Exemples
`'test'`	4 918
`'validation'`	507

Exemples ( tfds.as_dataframe ):

mlqa/vi

Description de la configuration : MLQA 'vi' dev et test splits.
Taille du jeu de données : 8.77 MiB
Fractionnements :

Diviser	Exemples
`'test'`	5 495
`'validation'`	511

Exemples ( tfds.as_dataframe ):

mlqa/zh

Description de la configuration : MLQA 'zh' dev et test splits.
Taille du jeu de données : 5.13 MiB
Fractionnements :

Diviser	Exemples
`'test'`	5 137
`'validation'`	504

Exemples ( tfds.as_dataframe ):

mlqa Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.