xtreme_xnli

  • Descrizione :

Questo set di dati contiene traduzioni automatiche di MNLI in ciascuna delle lingue XNLI. I dati di traduzione sono forniti da XTREME. Si noti che questo è diverso dai dati tradotti automaticamente forniti dal documento XNLI originale.

Diviso Esempi
'train' 392.570
  • Struttura delle caratteristiche :
FeaturesDict({
    'hypothesis': TranslationVariableLanguages({
        'language': Text(shape=(), dtype=string),
        'translation': Text(shape=(), dtype=string),
    }),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Translation({
        'ar': Text(shape=(), dtype=string),
        'bg': Text(shape=(), dtype=string),
        'de': Text(shape=(), dtype=string),
        'el': Text(shape=(), dtype=string),
        'en': Text(shape=(), dtype=string),
        'es': Text(shape=(), dtype=string),
        'fr': Text(shape=(), dtype=string),
        'hi': Text(shape=(), dtype=string),
        'ru': Text(shape=(), dtype=string),
        'sw': Text(shape=(), dtype=string),
        'th': Text(shape=(), dtype=string),
        'tr': Text(shape=(), dtype=string),
        'ur': Text(shape=(), dtype=string),
        'vi': Text(shape=(), dtype=string),
        'zh': Text(shape=(), dtype=string),
    }),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
ipotesi TranslationVariableLanguages
ipotesi/linguaggio Testo corda
ipotesi/traduzione Testo corda
etichetta ClassLabel int64
premessa Traduzione
premessa/ar Testo corda
premessa/bg Testo corda
premessa/de Testo corda
premessa/el Testo corda
premessa/it Testo corda
premessa/es Testo corda
premessa/fr Testo corda
premessa/ciao Testo corda
premessa/ru Testo corda
premessa/sw Testo corda
premessa/th Testo corda
premessa/tr Testo corda
premessa/ur Testo corda
premessa/vi Testo corda
premessa/zh Testo corda
  • Citazione :
@article{hu2020xtreme,
      author    = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title     = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal   = {CoRR},
      volume    = {abs/2003.11080},
      year      = {2020},
      archivePrefix = {arXiv},
      eprint    = {2003.11080}
}