openbookqa

Descrizione :

Il set di dati contiene 5.957 domande a scelta multipla a 4 vie. Inoltre, forniscono 5.167 fatti di conoscenza comune di crowdsourcing e una versione ampliata delle domande train/dev/test in cui ogni domanda è associata al suo fatto fondamentale di origine, un punteggio di accuratezza umana, un punteggio di chiarezza e un crowd-worker anonimo ID.

Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://leaderboard.allenai.org/open_book_qa/submissions/get-started
Codice sorgente : tfds.datasets.openbookqa.Builder
Versioni :
- 0.1.0 (impostazione predefinita): nessuna nota di rilascio.
Dimensione del download : 1.38 MiB
Dimensione del set di dati : 2.40 MiB
Auto-cache ( documentazione ): Sì
Divisioni :

Diviso	Esempi
`'test'`	500
`'train'`	4.957
`'validation'`	500

Struttura delle caratteristiche :

FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'clarity': float32,
    'fact1': Text(shape=(), dtype=string),
    'humanScore': float32,
    'question': FeaturesDict({
        'choice_A': Text(shape=(), dtype=string),
        'choice_B': Text(shape=(), dtype=string),
        'choice_C': Text(shape=(), dtype=string),
        'choice_D': Text(shape=(), dtype=string),
        'stem': Text(shape=(), dtype=string),
    }),
    'turkIdAnonymized': Text(shape=(), dtype=string),
})

Documentazione delle funzionalità :

Caratteristica	Classe	Tipo D
	CaratteristicheDict
tasto di risposta	ClassLabel	int64
chiarezza	Tensore	galleggiante32
fatto1	Testo	corda
humanScore	Tensore	galleggiante32
domanda	CaratteristicheDict
domanda/scelta_A	Testo	corda
domanda/scelta_B	Testo	corda
domanda/scelta_C	Testo	corda
domanda/scelta_D	Testo	corda
domanda/radice	Testo	corda
turkIdAnonimizzato	Testo	corda

Chiavi supervisionate (Vedi as_supervised doc ): ('question', 'answerKey')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):

Citazione :

@article{mihaylov2018can,
  title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal={arXiv preprint arXiv:1809.02789},
  year={2018}
}