- Descriptif :
Race est un ensemble de données de compréhension de lecture à grande échelle avec plus de 28 000 passages et près de 100 000 questions. L'ensemble de données est collecté à partir d'examens d'anglais en Chine, qui sont conçus pour les collégiens et lycéens. L'ensemble de données peut servir d'ensembles d'entraînement et de test pour la compréhension de la machine.
Documentation complémentaire : Explorer sur Papers With Code
Description de la configuration : configuration du générateur pour le jeu de données RACE.
Page d' accueil : https://www.cs.cmu.edu/~glai1/data/race/
Code source :
tfds.datasets.race.BuilderVersions :
-
1.0.0: Version initiale. -
2.0.0(par défaut) : Ajoutez l'exemple d'identifiant.
-
Taille du téléchargement :
24.26 MiBMise en cache automatique ( documentation ): Oui
Structure des fonctionnalités :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- Documentation des fonctionnalités :
| Caractéristique | Classe | Façonner | Dtype | Description |
|---|---|---|---|---|
| FonctionnalitésDict | ||||
| réponses | Séquence (texte) | (Aucun,) | chaîne de caractères | |
| article | Texte | chaîne de caractères | ||
| example_id | Texte | chaîne de caractères | ||
| choix | Séquence(Séquence(Texte)) | (Aucun, Aucun) | chaîne de caractères | |
| des questions | Séquence (texte) | (Aucun,) | chaîne de caractères |
Clés supervisées (Voir
as_superviseddoc ):NoneFigure ( tfds.show_examples ) : non pris en charge.
Citation :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
race/high (configuration par défaut)
Taille du jeu de données :
52.39 MiBFractionnements :
| Diviser | Exemples |
|---|---|
'dev' | 1 021 |
'test' | 1 045 |
'train' | 18 728 |
- Exemples ( tfds.as_dataframe ):
race/milieu
Taille du jeu de données :
12.51 MiBFractionnements :
| Diviser | Exemples |
|---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6 409 |
- Exemples ( tfds.as_dataframe ):