fantascienza

  • Descrizione :

Il set di dati SciTail è un set di dati di implicazione creato da esami scientifici a scelta multipla e frasi web. Ogni domanda e la scelta della risposta corretta vengono convertite in un'affermazione assertiva per formare l'ipotesi. Il recupero delle informazioni viene utilizzato per ottenere testo pertinente da un ampio corpus testuale di frasi web, e queste frasi sono usate come premessa P. per creare il set di dati SciTail. Il set di dati contiene 27.026 esempi con 10.101 esempi con etichetta implica e 16.925 esempi con etichetta neutra.

Diviso Esempi
'test' 2.126
'train' 23.097
'validation' 1.304
  • Struttura delle caratteristiche :
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'premise': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
ipotesi Testo corda
etichetta ClassLabel int64
premessa Testo corda
  • Citazione :
@inproceedings{khot2018scitail,
    title={Scitail: A textual entailment dataset from science question answering},
    author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
    booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
    url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
    year={2018}
}