- opis :
Race to wielkoskalowy zbiór danych dotyczących czytania ze zrozumieniem, zawierający ponad 28 000 fragmentów i prawie 100 000 pytań. Zbiór danych jest zbierany z egzaminów z języka angielskiego w Chinach, które są przeznaczone dla uczniów gimnazjów i szkół średnich. Zbiór danych może służyć jako zestaw szkoleniowy i testowy do rozumienia maszynowego.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Opis konfiguracji: Konfigurator konfiguracji zestawu danych RACE.
Strona główna : https://www.cs.cmu.edu/~glai1/data/race/
Kod źródłowy :
tfds.datasets.race.Builder
Wersje :
-
1.0.0
: Pierwsza wersja. -
2.0.0
(domyślnie): Dodaj identyfikator przykładu.
-
Rozmiar pliku do pobrania :
24.26 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Struktura funkcji :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształtować się | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odpowiedzi | Sekwencja (tekst) | (Nic,) | strunowy | |
artykuł | Tekst | strunowy | ||
identyfikator_przykładu | Tekst | strunowy | ||
opcje | Sekwencja(Sekwencja(Tekst)) | (Brak, brak) | strunowy | |
pytania | Sekwencja (tekst) | (Nic,) | strunowy |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
race/high (domyślna konfiguracja)
Rozmiar zestawu danych :
52.39 MiB
Podziały :
Podział | Przykłady |
---|---|
'dev' | 1021 |
'test' | 1045 |
'train' | 18728 |
- Przykłady ( tfds.as_dataframe ):
rasa/środek
Rozmiar zestawu danych :
12.51 MiB
Podziały :
Podział | Przykłady |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6409 |
- Przykłady ( tfds.as_dataframe ):