Drużyna

  • opis :

Stanford Question Answering Dataset (SQuAD) to zbiór danych dotyczących czytania ze zrozumieniem, składający się z pytań zadawanych przez pracowników społecznościowych w zbiorze artykułów Wikipedii, gdzie odpowiedzią na każde pytanie jest fragment tekstu lub zakres z odpowiedniego fragmentu do czytania lub pytanie może być bez odpowiedzi.

@article{2016arXiv160605250R,
       author
= { {Rajpurkar}, Pranav and {Zhang}, Jian and {Lopyrev},
                 
Konstantin and {Liang}, Percy},
        title
= "{SQuAD: 100,000+ Questions for Machine Comprehension of Text}",
      journal
= {arXiv e-prints},
         year
= 2016,
          eid
= {arXiv:1606.05250},
        pages
= {arXiv:1606.05250},
archivePrefix
= {arXiv},
       eprint
= {1606.05250},
}

oddział/v1.1 (domyślna konfiguracja)

  • Opis konfiguracji: Wersja 1.1.0 SQUAD

  • Rozmiar pliku do pobrania : 33.51 MiB

  • Rozmiar zestawu danych : 94.06 MiB

  • Automatyczne buforowanie ( dokumentacja ): Tak

  • Podziały :

Podział Przykłady
'train' 87 599
'validation' 10570
  • Struktura funkcji :
FeaturesDict({
   
'answers': Sequence({
       
'answer_start': int32,
       
'text': Text(shape=(), dtype=string),
   
}),
   
'context': Text(shape=(), dtype=string),
   
'id': string,
   
'question': Text(shape=(), dtype=string),
   
'title': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
odpowiedzi Sekwencja
odpowiedzi/odpowiedź_start Napinacz int32
odpowiedzi/tekst Tekst strunowy
kontekst Tekst strunowy
ID Napinacz strunowy
pytanie Tekst strunowy
tytuł Tekst strunowy

skład/v2.0

  • Opis konfiguracji: Wersja 2.0.0 SQUAD

  • Rozmiar pliku do pobrania : 44.34 MiB

  • Rozmiar zestawu danych : 148.54 MiB

  • Automatyczne buforowanie ( dokumentacja ): Tak (walidacja), Tylko wtedy, gdy shuffle_files=False (pociąg)

  • Podziały :

Podział Przykłady
'train' 130319
'validation' 11873
  • Struktura funkcji :
FeaturesDict({
   
'answers': Sequence({
       
'answer_start': int32,
       
'text': Text(shape=(), dtype=string),
   
}),
   
'context': Text(shape=(), dtype=string),
   
'id': string,
   
'is_impossible': bool,
   
'plausible_answers': Sequence({
       
'answer_start': int32,
       
'text': Text(shape=(), dtype=string),
   
}),
   
'question': Text(shape=(), dtype=string),
   
'title': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
odpowiedzi Sekwencja
odpowiedzi/odpowiedź_start Napinacz int32
odpowiedzi/tekst Tekst strunowy
kontekst Tekst strunowy
ID Napinacz strunowy
jest niemożliwe Napinacz bool
wiarygodne_odpowiedzi Sekwencja
wiarygodne_answers/answer_start Napinacz int32
wiarygodne_odpowiedzi/tekst Tekst strunowy
pytanie Tekst strunowy
tytuł Tekst strunowy