- opis :
Race to wielkoskalowy zbiór danych dotyczących czytania ze zrozumieniem, zawierający ponad 28 000 fragmentów i prawie 100 000 pytań. Zbiór danych jest zbierany z egzaminów z języka angielskiego w Chinach, które są przeznaczone dla uczniów gimnazjów i szkół średnich. Zbiór danych może służyć jako zestaw szkoleniowy i testowy do rozumienia maszynowego.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Opis konfiguracji: Konfigurator konfiguracji zestawu danych RACE.
Strona główna : https://www.cs.cmu.edu/~glai1/data/race/
Kod źródłowy :
tfds.datasets.race.BuilderWersje :
-
1.0.0: Pierwsza wersja. -
2.0.0(domyślnie): Dodaj identyfikator przykładu.
-
Rozmiar pliku do pobrania :
24.26 MiBAutomatyczne buforowanie ( dokumentacja ): Tak
Struktura funkcji :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształtować się | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| odpowiedzi | Sekwencja (tekst) | (Nic,) | strunowy | |
| artykuł | Tekst | strunowy | ||
| identyfikator_przykładu | Tekst | strunowy | ||
| opcje | Sekwencja(Sekwencja(Tekst)) | (Brak, brak) | strunowy | |
| pytania | Sekwencja (tekst) | (Nic,) | strunowy |
Klucze nadzorowane (Zobacz dokument
as_supervised):NoneRysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
race/high (domyślna konfiguracja)
Rozmiar zestawu danych :
52.39 MiBPodziały :
| Podział | Przykłady |
|---|---|
'dev' | 1021 |
'test' | 1045 |
'train' | 18728 |
- Przykłady ( tfds.as_dataframe ):
rasa/środek
Rozmiar zestawu danych :
12.51 MiBPodziały :
| Podział | Przykłady |
|---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6409 |
- Przykłady ( tfds.as_dataframe ):