- Deskripsi :
Race adalah kumpulan data pemahaman bacaan berskala besar dengan lebih dari 28.000 bagian dan hampir 100.000 pertanyaan. Kumpulan data dikumpulkan dari ujian bahasa Inggris di China, yang dirancang untuk siswa sekolah menengah dan sekolah menengah atas. Dataset dapat berfungsi sebagai set pelatihan dan pengujian untuk pemahaman mesin.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Deskripsi konfigurasi : Konfigurasi pembangun untuk set data RACE.
Beranda : https://www.cs.cmu.edu/~glai1/data/race/
Kode sumber :
tfds.datasets.race.Builder
Versi :
-
1.0.0
: Rilis awal. -
2.0.0
(default): Tambahkan id contoh.
-
Ukuran unduhan :
24.26 MiB
Di-cache otomatis ( dokumentasi ): Ya
Struktur fitur :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
jawaban | Urutan (Teks) | (Tidak ada,) | rangkaian | |
artikel | Teks | rangkaian | ||
example_id | Teks | rangkaian | ||
pilihan | Urutan(Urutan(Teks)) | (Tidak ada, Tidak ada) | rangkaian | |
pertanyaan | Urutan (Teks) | (Tidak ada,) | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
ras/tinggi (konfigurasi default)
Ukuran dataset :
52.39 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'dev' | 1.021 |
'test' | 1.045 |
'train' | 18.728 |
- Contoh ( tfds.as_dataframe ):
ras/tengah
Ukuran dataset :
12.51 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6.409 |
- Contoh ( tfds.as_dataframe ):