xtreme_xnli

  • Mô tả :

Bộ dữ liệu này chứa các bản dịch máy của MNLI sang từng ngôn ngữ XNLI. Dữ liệu dịch được cung cấp bởi XTREME. Lưu ý rằng dữ liệu này khác với dữ liệu được dịch bằng máy do bài báo XNLI gốc cung cấp.

Tách ra ví dụ
'train' 392,570
  • Cấu trúc tính năng :
FeaturesDict({
   
'hypothesis': TranslationVariableLanguages({
       
'language': Text(shape=(), dtype=string),
       
'translation': Text(shape=(), dtype=string),
   
}),
   
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
   
'premise': Translation({
       
'ar': Text(shape=(), dtype=string),
       
'bg': Text(shape=(), dtype=string),
       
'de': Text(shape=(), dtype=string),
       
'el': Text(shape=(), dtype=string),
       
'en': Text(shape=(), dtype=string),
       
'es': Text(shape=(), dtype=string),
       
'fr': Text(shape=(), dtype=string),
       
'hi': Text(shape=(), dtype=string),
       
'ru': Text(shape=(), dtype=string),
       
'sw': Text(shape=(), dtype=string),
       
'th': Text(shape=(), dtype=string),
       
'tr': Text(shape=(), dtype=string),
       
'ur': Text(shape=(), dtype=string),
       
'vi': Text(shape=(), dtype=string),
       
'zh': Text(shape=(), dtype=string),
   
}),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
giả thuyết DịchBiếnNgôn ngữ
giả thuyết/ngôn ngữ Chữ sợi dây
giả thuyết/bản dịch Chữ sợi dây
nhãn mác LớpNhãn int64
tiền đề Dịch
tiền đề / ar Chữ sợi dây
tiền đề/bg Chữ sợi dây
tiền đề / de Chữ sợi dây
tiền đề / el Chữ sợi dây
tiền đề/vi Chữ sợi dây
tiền đề / es Chữ sợi dây
tiền đề / fr Chữ sợi dây
tiền đề / xin chào Chữ sợi dây
tiền đề / ru Chữ sợi dây
tiền đề/sw Chữ sợi dây
tiền đề / thứ Chữ sợi dây
tiền đề/tr Chữ sợi dây
tiền đề / bạn Chữ sợi dây
tiền đề/vi Chữ sợi dây
tiền đề/zh Chữ sợi dây
  • trích dẫn :
@article{hu2020xtreme,
      author    
= {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title    
= {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal  
= {CoRR},
      volume    
= {abs/2003.11080},
      year      
= {2020},
      archivePrefix
= {arXiv},
      eprint    
= {2003.11080}
}