- Deskripsi :
Kumpulan data ini berisi terjemahan mesin MNLI ke dalam setiap bahasa XNLI. Data terjemahan disediakan oleh XTREME. Perhatikan bahwa ini berbeda dari data terjemahan mesin yang disediakan oleh kertas XNLI asli.
Kode sumber :
tfds.text.xtreme_xnli.XtremeXnli
Versi :
-
1.1.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
2.31 GiB
Ukuran dataset :
1.59 GiB
Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 392.570 |
- Struktur fitur :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
hipotesa | Terjemahan VariabelBahasa | |||
hipotesis/bahasa | Teks | rangkaian | ||
hipotesis/terjemahan | Teks | rangkaian | ||
label | LabelKelas | int64 | ||
premis | Terjemahan | |||
premis/ar | Teks | rangkaian | ||
premis/bg | Teks | rangkaian | ||
premis/de | Teks | rangkaian | ||
premis/el | Teks | rangkaian | ||
premis/en | Teks | rangkaian | ||
premis | Teks | rangkaian | ||
premis/fr | Teks | rangkaian | ||
premis / hai | Teks | rangkaian | ||
premis/ru | Teks | rangkaian | ||
premis / sw | Teks | rangkaian | ||
premis/th | Teks | rangkaian | ||
premis/tr | Teks | rangkaian | ||
premis/ur | Teks | rangkaian | ||
premis/vi | Teks | rangkaian | ||
premis/zh | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}