libroabiertoqa

  • Descripción :

El conjunto de datos contiene 5.957 preguntas de opción múltiple de 4 vías. Además, proporcionan 5167 datos de conocimiento común de fuentes múltiples y una versión ampliada de las preguntas de entrenamiento/desarrollo/prueba en las que cada pregunta está asociada con su hecho central de origen, una puntuación de precisión humana, una puntuación de claridad y un trabajador colectivo anónimo. IDENTIFICACIÓN.

Separar Ejemplos
'test' 500
'train' 4,957
'validation' 500
  • Estructura de características :
FeaturesDict({
   
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
   
'clarity': float32,
   
'fact1': Text(shape=(), dtype=string),
   
'humanScore': float32,
   
'question': FeaturesDict({
       
'choice_A': Text(shape=(), dtype=string),
       
'choice_B': Text(shape=(), dtype=string),
       
'choice_C': Text(shape=(), dtype=string),
       
'choice_D': Text(shape=(), dtype=string),
       
'stem': Text(shape=(), dtype=string),
   
}),
   
'turkIdAnonymized': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
clave de respuesta Etiqueta de clase int64
claridad Tensor flotar32
hecho1 Texto cuerda
puntuación humana Tensor flotar32
pregunta CaracterísticasDict
pregunta/elección_A Texto cuerda
pregunta/elección_B Texto cuerda
pregunta/elección_C Texto cuerda
pregunta/elección_D Texto cuerda
pregunta/raíz Texto cuerda
turkIdAnonimizado Texto cuerda
  • Cita :
@article{mihaylov2018can,
  title
={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author
={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal
={arXiv preprint arXiv:1809.02789},
  year
={2018}
}