- Deskripsi :
Kumpulan data ini berisi terjemahan mesin dari data pelatihan PAWS bahasa Inggris. Terjemahan disediakan oleh tolok ukur XTREME dan mencakup bahasa-bahasa berikut:
- Perancis
- Orang Spanyol
- Jerman
- Cina
- Jepang
- Korea
Untuk perincian lebih lanjut tentang PAWS, lihat makalah: PAWS: Paraphrase Adversaries from Word Scrambling di https://arxiv.org/abs/1904.01130 dan PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification di https://arxiv. org/abs/1908.11828
Untuk perincian terkait XTREME, silakan merujuk ke: XTREME: Tolok Ukur Multi-tugas Multibahasa Masif untuk Mengevaluasi Generalisasi Lintas Bahasa di https://arxiv.org/abs/2003.11080
Kode sumber :
tfds.text.xtreme_pawsx.XtremePawsx
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Di-cache otomatis ( dokumentasi ): Ya
Struktur fitur :
FeaturesDict({
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sentence1': Text(shape=(), dtype=string),
'sentence2': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
label | LabelKelas | int64 | ||
kalimat1 | Teks | rangkaian | ||
kalimat2 | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}
xtreme_pawsx/de (konfigurasi default)
Deskripsi konfigurasi : Diterjemahkan ke de
Ukuran unduhan :
22.34 MiB
Ukuran dataset :
14.19 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 49.340 |
- Contoh ( tfds.as_dataframe ):
xtreme_pawsx/es
Deskripsi konfigurasi : Diterjemahkan ke es
Ukuran unduhan :
22.27 MiB
Ukuran dataset :
14.09 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 49.244 |
- Contoh ( tfds.as_dataframe ):
xtreme_pawsx/fr
Deskripsi konfigurasi : Diterjemahkan ke fr
Ukuran unduhan :
22.70 MiB
Ukuran dataset :
14.53 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 49.208 |
- Contoh ( tfds.as_dataframe ):
xtreme_pawsx/ja
Deskripsi konfigurasi : Diterjemahkan ke ja
Ukuran unduhan :
25.12 MiB
Ukuran dataset :
16.98 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 49.086 |
- Contoh ( tfds.as_dataframe ):
xtreme_pawsx/ko
Deskripsi konfigurasi : Diterjemahkan ke ko
Ukuran unduhan :
22.99 MiB
Ukuran dataset :
14.86 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 49.298 |
- Contoh ( tfds.as_dataframe ):
xtreme_pawsx/zh
Deskripsi konfigurasi : Diterjemahkan ke zh
Ukuran unduhan :
21.45 MiB
Ukuran dataset :
13.21 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 49.149 |
- Contoh ( tfds.as_dataframe ):