açık kitapka

  • Açıklama :

Veri seti 5.957 adet 4'lü çoktan seçmeli soru içermektedir. Ek olarak, 5.167 kitle kaynaklı ortak bilgi olgusu ve her sorunun kaynak temel olgusu, bir insan doğruluk puanı, bir netlik puanı ve anonimleştirilmiş bir kitle çalışanı ile ilişkilendirildiği eğit/geliştir/test sorularının genişletilmiş bir sürümünü sağlarlar. İD.

Bölmek örnekler
'test' 500
'train' 4.957
'validation' 500
  • Özellik yapısı :
FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'clarity': float32,
    'fact1': Text(shape=(), dtype=string),
    'humanScore': float32,
    'question': FeaturesDict({
        'choice_A': Text(shape=(), dtype=string),
        'choice_B': Text(shape=(), dtype=string),
        'choice_C': Text(shape=(), dtype=string),
        'choice_D': Text(shape=(), dtype=string),
        'stem': Text(shape=(), dtype=string),
    }),
    'turkIdAnonymized': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
cevap anahtarı SınıfEtiketi int64
netlik tensör şamandıra32
gerçek1 Metin sicim
insan Puanı tensör şamandıra32
soru ÖzelliklerDict
soru/seçenek_A Metin sicim
soru/seçenek_B Metin sicim
soru/seçenek_C Metin sicim
soru/seçim_D Metin sicim
soru/kök Metin sicim
turkIdAnonimleştirilmiş Metin sicim
  • Alıntı :
@article{mihaylov2018can,
  title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal={arXiv preprint arXiv:1809.02789},
  year={2018}
}