openbookqa

  • Deskripsi :

Dataset berisi 5.957 soal pilihan ganda 4 arah. Selain itu, mereka memberikan 5.167 fakta pengetahuan umum yang bersumber dari banyak orang, dan versi yang diperluas dari pertanyaan kereta/pengembangan/tes di mana setiap pertanyaan dikaitkan dengan fakta inti asalnya, skor akurasi manusia, skor kejelasan, dan pekerja kerumunan yang dianonimkan PENGENAL.

Membelah Contoh
'test' 500
'train' 4.957
'validation' 500
  • Struktur fitur :
FeaturesDict({
   
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
   
'clarity': float32,
   
'fact1': Text(shape=(), dtype=string),
   
'humanScore': float32,
   
'question': FeaturesDict({
       
'choice_A': Text(shape=(), dtype=string),
       
'choice_B': Text(shape=(), dtype=string),
       
'choice_C': Text(shape=(), dtype=string),
       
'choice_D': Text(shape=(), dtype=string),
       
'stem': Text(shape=(), dtype=string),
   
}),
   
'turkIdAnonymized': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
kunci jawaban LabelKelas int64
kejelasan Tensor float32
fakta1 Teks rangkaian
humanScore Tensor float32
pertanyaan fiturDict
pertanyaan/pilihan_A Teks rangkaian
pertanyaan/pilihan_B Teks rangkaian
pertanyaan/pilihan_C Teks rangkaian
pertanyaan/pilihan_D Teks rangkaian
pertanyaan/batang Teks rangkaian
turkIdAnonymized Teks rangkaian
  • Kutipan :
@article{mihaylov2018can,
  title
={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author
={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal
={arXiv preprint arXiv:1809.02789},
  year
={2018}
}