mlqa

  • Descriptif :

MLQA (Multilingual Question Answering Dataset) est un ensemble de données de référence pour évaluer les performances de réponse aux questions multilingues. Le jeu de données se compose de 7 langues : arabe, allemand, espagnol, anglais, hindi, vietnamien, chinois.

FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'context': Text(shape=(), dtype=string),
    'id': string,
    'question': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Dtype Description
FonctionnalitésDict
réponses Séquence
réponses/answer_start Tenseur int32
réponses/texte Texte chaîne
contexte Texte chaîne
identifiant Tenseur chaîne
question Texte chaîne
titre Texte chaîne
@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa/ar (configuration par défaut)

  • Description de la configuration : MLQA 'ar' dev et test splits.

  • Taille du jeu de données : 9.28 MiB

  • Fractionnements :

Diviser Exemples
'test' 5 335
'validation' 517

mlqa/de

  • Description de la configuration : MLQA 'de' dev et test splits.

  • Taille du jeu de données : 5.06 MiB

  • Fractionnements :

Diviser Exemples
'test' 4 517
'validation' 512

mlqa/fr

  • Description de la configuration : MLQA 'en' dev et test splits.

  • Taille du jeu de données : 15.72 MiB

  • Fractionnements :

Diviser Exemples
'test' 11 590
'validation' 1 148

mlqa/es

  • Description de la configuration : MLQA 'es' dev et test splits.

  • Taille du jeu de données : 5.09 MiB

  • Fractionnements :

Diviser Exemples
'test' 5 253
'validation' 500

mlqa/salut

  • Description de la configuration : MLQA 'hi' dev et test splits.

  • Taille du jeu de données : 12.83 MiB

  • Fractionnements :

Diviser Exemples
'test' 4 918
'validation' 507

mlqa/vi

  • Description de la configuration : MLQA 'vi' dev et test splits.

  • Taille du jeu de données : 8.77 MiB

  • Fractionnements :

Diviser Exemples
'test' 5 495
'validation' 511

mlqa/zh

  • Description de la configuration : MLQA 'zh' dev et test splits.

  • Taille du jeu de données : 5.13 MiB

  • Fractionnements :

Diviser Exemples
'test' 5 137
'validation' 504