- Deskripsi :
MLQA (Multilingual Question Answering Dataset) adalah dataset tolok ukur untuk mengevaluasi performa menjawab pertanyaan multibahasa. Dataset terdiri dari 7 bahasa: Arab, Jerman, Spanyol, Inggris, Hindi, Vietnam, Cina.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://github.com/facebookresearch/MLQA
Kode sumber :
tfds.datasets.mlqa.Builder
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
72.21 MiB
Di-cache otomatis ( dokumentasi ): Ya
Struktur fitur :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
jawaban | Urutan | |||
jawaban/jawaban_mulai | Tensor | int32 | ||
jawaban/teks | Teks | rangkaian | ||
konteks | Teks | rangkaian | ||
pengenal | Tensor | rangkaian | ||
pertanyaan | Teks | rangkaian | ||
judul | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa/ar (konfigurasi default)
Deskripsi konfigurasi : MLQA 'ar' dev dan test split.
Ukuran dataset :
9.28 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 5.335 |
'validation' | 517 |
- Contoh ( tfds.as_dataframe ):
mlqa/de
Deskripsi konfigurasi : MLQA 'de' dev dan test split.
Ukuran dataset :
5.06 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 4.517 |
'validation' | 512 |
- Contoh ( tfds.as_dataframe ):
mlqa/en
Deskripsi konfigurasi : MLQA 'en' dev dan test split.
Ukuran dataset :
15.72 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 11.590 |
'validation' | 1.148 |
- Contoh ( tfds.as_dataframe ):
mlqa/es
Deskripsi konfigurasi : MLQA 'es' dev dan test split.
Ukuran dataset :
5.09 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 5.253 |
'validation' | 500 |
- Contoh ( tfds.as_dataframe ):
mlqa/hi
Deskripsi konfigurasi : MLQA 'hi' dev dan test split.
Ukuran dataset :
12.83 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 4.918 |
'validation' | 507 |
- Contoh ( tfds.as_dataframe ):
mlqa/vi
Deskripsi konfigurasi : MLQA 'vi' dev dan test split.
Ukuran dataset :
8.77 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 5.495 |
'validation' | 511 |
- Contoh ( tfds.as_dataframe ):
mlqa/zh
Deskripsi konfigurasi : MLQA 'zh' dev dan test split.
Ukuran dataset :
5.13 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 5.137 |
'validation' | 504 |
- Contoh ( tfds.as_dataframe ):