- Descrizione :
Il set di dati SciTail è un set di dati di implicazione creato da esami scientifici a scelta multipla e frasi web. Ogni domanda e la scelta della risposta corretta vengono convertite in un'affermazione assertiva per formare l'ipotesi. Il recupero delle informazioni viene utilizzato per ottenere testo pertinente da un ampio corpus testuale di frasi web, e queste frasi sono usate come premessa P. per creare il set di dati SciTail. Il set di dati contiene 27.026 esempi con 10.101 esempi con etichetta implica e 16.925 esempi con etichetta neutra.
Documentazione aggiuntiva : Esplora documenti con codice
Homepage : https://allenai.org/data/scitail
Codice sorgente :
tfds.datasets.sci_tail.Builder
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale.
-
Dimensione del download :
13.52 MiB
Dimensione del set di dati:
6.01 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'test' | 2.126 |
'train' | 23.097 |
'validation' | 1.304 |
- Struttura delle caratteristiche :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'premise': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
ipotesi | Testo | corda | ||
etichetta | ClassLabel | int64 | ||
premessa | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@inproceedings{khot2018scitail,
title={Scitail: A textual entailment dataset from science question answering},
author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
year={2018}
}