xtreme_xnli

  • Descrição :

Este conjunto de dados contém traduções automáticas de MNLI em cada um dos idiomas XNLI. Os dados de tradução são fornecidos pela XTREME. Observe que isso é diferente dos dados traduzidos por máquina fornecidos pelo documento XNLI original.

Dividir Exemplos
'train' 392.570
  • Estrutura de recursos :
FeaturesDict({
   
'hypothesis': TranslationVariableLanguages({
       
'language': Text(shape=(), dtype=string),
       
'translation': Text(shape=(), dtype=string),
   
}),
   
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
   
'premise': Translation({
       
'ar': Text(shape=(), dtype=string),
       
'bg': Text(shape=(), dtype=string),
       
'de': Text(shape=(), dtype=string),
       
'el': Text(shape=(), dtype=string),
       
'en': Text(shape=(), dtype=string),
       
'es': Text(shape=(), dtype=string),
       
'fr': Text(shape=(), dtype=string),
       
'hi': Text(shape=(), dtype=string),
       
'ru': Text(shape=(), dtype=string),
       
'sw': Text(shape=(), dtype=string),
       
'th': Text(shape=(), dtype=string),
       
'tr': Text(shape=(), dtype=string),
       
'ur': Text(shape=(), dtype=string),
       
'vi': Text(shape=(), dtype=string),
       
'zh': Text(shape=(), dtype=string),
   
}),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
hipótese TranslationVariableLanguages
hipótese/linguagem Texto corda
hipótese/tradução Texto corda
etiqueta ClassLabel int64
premissa Tradução
premissa/ar Texto corda
premissa/bg Texto corda
premissa/de Texto corda
premissa/el Texto corda
premissa/pt Texto corda
premissa(s) Texto corda
premissa/fr Texto corda
premissa/oi Texto corda
premissa/ru Texto corda
premissa/sw Texto corda
premissa/th Texto corda
premissa/tr Texto corda
premissa/ur Texto corda
premissa/vi Texto corda
premissa/zh Texto corda
  • Citação :
@article{hu2020xtreme,
      author    
= {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title    
= {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal  
= {CoRR},
      volume    
= {abs/2003.11080},
      year      
= {2020},
      archivePrefix
= {arXiv},
      eprint    
= {2003.11080}
}