- Descrizione :
Race è un set di dati di comprensione della lettura su larga scala con oltre 28.000 passaggi e quasi 100.000 domande. Il set di dati viene raccolto dagli esami di inglese in Cina, progettati per studenti delle scuole medie e superiori. Il set di dati può essere utilizzato come set di addestramento e test per la comprensione della macchina.
Documentazione aggiuntiva : Esplora documenti con codice
Descrizione della configurazione: configurazione del builder per il set di dati RACE.
Pagina iniziale : https://www.cs.cmu.edu/~glai1/data/race/
Codice sorgente :
tfds.datasets.race.BuilderVersioni :
-
1.0.0: Versione iniziale. -
2.0.0(impostazione predefinita): aggiungi l'id di esempio.
-
Dimensione del download :
24.26 MiBAuto-cache ( documentazione ): Sì
Struttura delle caratteristiche :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| risposte | Sequenza(Testo) | (Nessuno,) | corda | |
| articolo | Testo | corda | ||
| esempio_id | Testo | corda | ||
| opzioni | Sequenza(Sequenza(Testo)) | (Nessuno, nessuno) | corda | |
| domande | Sequenza(Testo) | (Nessuno,) | corda |
Chiavi supervisionate (Vedi
as_superviseddoc ):NoneFigura ( tfds.show_examples ): non supportato.
Citazione :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
razza/alta (configurazione predefinita)
Dimensione del set di dati:
52.39 MiBDivisioni :
| Diviso | Esempi |
|---|---|
'dev' | 1.021 |
'test' | 1.045 |
'train' | 18.728 |
- Esempi ( tfds.as_dataframe ):
razza/mezzo
Dimensione del set di dati:
12.51 MiBDivisioni :
| Diviso | Esempi |
|---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6.409 |
- Esempi ( tfds.as_dataframe ):