mlqa

  • Deskripsi :

MLQA (Multilingual Question Answering Dataset) adalah dataset tolok ukur untuk mengevaluasi performa menjawab pertanyaan multibahasa. Dataset terdiri dari 7 bahasa: Arab, Jerman, Spanyol, Inggris, Hindi, Vietnam, Cina.

FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'context': Text(shape=(), dtype=string),
    'id': string,
    'question': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
jawaban Urutan
jawaban/jawaban_mulai Tensor int32
jawaban/teks Teks rangkaian
konteks Teks rangkaian
pengenal Tensor rangkaian
pertanyaan Teks rangkaian
judul Teks rangkaian
@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa/ar (konfigurasi default)

  • Deskripsi konfigurasi : MLQA 'ar' dev dan test split.

  • Ukuran dataset : 9.28 MiB

  • Perpecahan :

Membelah Contoh
'test' 5.335
'validation' 517

mlqa/de

  • Deskripsi konfigurasi : MLQA 'de' dev dan test split.

  • Ukuran dataset : 5.06 MiB

  • Perpecahan :

Membelah Contoh
'test' 4.517
'validation' 512

mlqa/en

  • Deskripsi konfigurasi : MLQA 'en' dev dan test split.

  • Ukuran dataset : 15.72 MiB

  • Perpecahan :

Membelah Contoh
'test' 11.590
'validation' 1.148

mlqa/es

  • Deskripsi konfigurasi : MLQA 'es' dev dan test split.

  • Ukuran dataset : 5.09 MiB

  • Perpecahan :

Membelah Contoh
'test' 5.253
'validation' 500

mlqa/hi

  • Deskripsi konfigurasi : MLQA 'hi' dev dan test split.

  • Ukuran dataset : 12.83 MiB

  • Perpecahan :

Membelah Contoh
'test' 4.918
'validation' 507

mlqa/vi

  • Deskripsi konfigurasi : MLQA 'vi' dev dan test split.

  • Ukuran dataset : 8.77 MiB

  • Perpecahan :

Membelah Contoh
'test' 5.495
'validation' 511

mlqa/zh

  • Deskripsi konfigurasi : MLQA 'zh' dev dan test split.

  • Ukuran dataset : 5.13 MiB

  • Perpecahan :

Membelah Contoh
'test' 5.137
'validation' 504