Wyścig

  • opis :

Race to wielkoskalowy zbiór danych dotyczących czytania ze zrozumieniem, zawierający ponad 28 000 fragmentów i prawie 100 000 pytań. Zbiór danych jest zbierany z egzaminów z języka angielskiego w Chinach, które są przeznaczone dla uczniów gimnazjów i szkół średnich. Zbiór danych może służyć jako zestaw szkoleniowy i testowy do rozumienia maszynowego.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształtować się Typ D Opis
FunkcjeDict
odpowiedzi Sekwencja (tekst) (Nic,) strunowy
artykuł Tekst strunowy
identyfikator_przykładu Tekst strunowy
opcje Sekwencja(Sekwencja(Tekst)) (Brak, brak) strunowy
pytania Sekwencja (tekst) (Nic,) strunowy
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

race/high (domyślna konfiguracja)

  • Rozmiar zestawu danych : 52.39 MiB

  • Podziały :

Podział Przykłady
'dev' 1021
'test' 1045
'train' 18728

rasa/środek

  • Rozmiar zestawu danych : 12.51 MiB

  • Podziały :

Podział Przykłady
'dev' 368
'test' 362
'train' 6409