xtreme_xnli

  • Mô tả :

Bộ dữ liệu này chứa các bản dịch máy của MNLI sang từng ngôn ngữ XNLI. Dữ liệu dịch được cung cấp bởi XTREME. Lưu ý rằng dữ liệu này khác với dữ liệu được dịch bằng máy do bài báo XNLI gốc cung cấp.

Tách ra ví dụ
'train' 392,570
  • Cấu trúc tính năng :
FeaturesDict({
    'hypothesis': TranslationVariableLanguages({
        'language': Text(shape=(), dtype=string),
        'translation': Text(shape=(), dtype=string),
    }),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Translation({
        'ar': Text(shape=(), dtype=string),
        'bg': Text(shape=(), dtype=string),
        'de': Text(shape=(), dtype=string),
        'el': Text(shape=(), dtype=string),
        'en': Text(shape=(), dtype=string),
        'es': Text(shape=(), dtype=string),
        'fr': Text(shape=(), dtype=string),
        'hi': Text(shape=(), dtype=string),
        'ru': Text(shape=(), dtype=string),
        'sw': Text(shape=(), dtype=string),
        'th': Text(shape=(), dtype=string),
        'tr': Text(shape=(), dtype=string),
        'ur': Text(shape=(), dtype=string),
        'vi': Text(shape=(), dtype=string),
        'zh': Text(shape=(), dtype=string),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
giả thuyết DịchBiếnNgôn ngữ
giả thuyết/ngôn ngữ Chữ sợi dây
giả thuyết/bản dịch Chữ sợi dây
nhãn mác LớpNhãn int64
tiền đề Dịch
tiền đề / ar Chữ sợi dây
tiền đề/bg Chữ sợi dây
tiền đề / de Chữ sợi dây
tiền đề / el Chữ sợi dây
tiền đề/vi Chữ sợi dây
tiền đề / es Chữ sợi dây
tiền đề / fr Chữ sợi dây
tiền đề / xin chào Chữ sợi dây
tiền đề / ru Chữ sợi dây
tiền đề/sw Chữ sợi dây
tiền đề / thứ Chữ sợi dây
tiền đề/tr Chữ sợi dây
tiền đề / bạn Chữ sợi dây
tiền đề/vi Chữ sợi dây
tiền đề/zh Chữ sợi dây
  • trích dẫn :
@article{hu2020xtreme,
      author    = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title     = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal   = {CoRR},
      volume    = {abs/2003.11080},
      year      = {2020},
      archivePrefix = {arXiv},
      eprint    = {2003.11080}
}