ırk

  • Açıklama :

Race, 28.000'den fazla pasaj ve yaklaşık 100.000 soru içeren büyük ölçekli bir okuduğunu anlama veri kümesidir. Veri seti, Çin'deki ortaokul ve lise öğrencileri için tasarlanmış İngilizce sınavlarından toplanmıştır. Veri kümesi, makine kavrayışı için eğitim ve test kümeleri olarak sunulabilir.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Açıklama
ÖzelliklerDict
Yanıtlar Sıra(Metin) (Hiçbiri,) sicim
makale Metin sicim
örnek_id Metin sicim
seçenekler Sıra(Sıra(Metin)) (Yok, Yok) sicim
sorular Sıra(Metin) (Hiçbiri,) sicim
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

yarış/yüksek (varsayılan yapılandırma)

  • Veri kümesi boyutu : 52.39 MiB

  • bölmeler :

Bölmek örnekler
'dev' 1.021
'test' 1.045
'train' 18.728

ırk/orta

  • Veri kümesi boyutu : 12.51 MiB

  • bölmeler :

Bölmek örnekler
'dev' 368
'test' 362
'train' 6.409