balapan

  • Deskripsi :

Race adalah kumpulan data pemahaman bacaan berskala besar dengan lebih dari 28.000 bagian dan hampir 100.000 pertanyaan. Kumpulan data dikumpulkan dari ujian bahasa Inggris di China, yang dirancang untuk siswa sekolah menengah dan sekolah menengah atas. Dataset dapat berfungsi sebagai set pelatihan dan pengujian untuk pemahaman mesin.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
jawaban Urutan (Teks) (Tidak ada,) rangkaian
artikel Teks rangkaian
example_id Teks rangkaian
pilihan Urutan(Urutan(Teks)) (Tidak ada, Tidak ada) rangkaian
pertanyaan Urutan (Teks) (Tidak ada,) rangkaian
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

ras/tinggi (konfigurasi default)

  • Ukuran dataset : 52.39 MiB

  • Perpecahan :

Membelah Contoh
'dev' 1.021
'test' 1.045
'train' 18.728

ras/tengah

  • Ukuran dataset : 12.51 MiB

  • Perpecahan :

Membelah Contoh
'dev' 368
'test' 362
'train' 6.409