- Descripción :
QASC es un conjunto de datos de preguntas y respuestas centrado en la composición de oraciones. Consta de 9980 preguntas de opción múltiple de 8 vías sobre ciencias de la escuela primaria (8134 tren, 926 desarrollo, 920 prueba) y viene con un corpus de 17 millones de oraciones.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://allenai.org/data/qasc
Código fuente :
tfds.datasets.qasc.Builder
Versiones :
-
0.1.0
(predeterminado): Sin notas de la versión.
-
Tamaño de la descarga :
1.54 MiB
Tamaño del conjunto de datos :
6.61 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 920 |
'train' | 8,134 |
'validation' | 926 |
- Estructura de características :
FeaturesDict({
'answerKey': Text(shape=(), dtype=string),
'choices': Sequence({
'label': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
}),
'combinedfact': Text(shape=(), dtype=string),
'fact1': Text(shape=(), dtype=string),
'fact2': Text(shape=(), dtype=string),
'formatted_question': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
clave de respuesta | Texto | cadena | ||
opciones | Secuencia | |||
opciones/etiqueta | Texto | cadena | ||
opciones/texto | Texto | cadena | ||
hecho combinado | Texto | cadena | ||
hecho1 | Texto | cadena | ||
hecho2 | Texto | cadena | ||
pregunta_formateada | Texto | cadena | ||
identificación | Texto | cadena | ||
pregunta | Texto | cadena |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@article{allenai:qasc,
author = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
title = {QASC: A Dataset for Question Answering via Sentence Composition},
journal = {arXiv:1910.11473v2},
year = {2020},
}