openbookqa

  • opis :

Zbiór danych zawiera 5957 4-kierunkowych pytań wielokrotnego wyboru. Ponadto dostarczają 5167 faktów z powszechnej wiedzy pochodzących z crowdsourcingu oraz rozszerzoną wersję pytań do treningu/programisty/testu, w których każde pytanie jest powiązane z podstawowym faktem, z którego pochodzi, wynikiem ludzkiej dokładności, wynikiem przejrzystości i anonimowym pracownikiem społecznościowym ID.

Rozdzielać Przykłady
'test' 500
'train' 4957
'validation' 500
  • Struktura funkcji :
FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'clarity': float32,
    'fact1': Text(shape=(), dtype=string),
    'humanScore': float32,
    'question': FeaturesDict({
        'choice_A': Text(shape=(), dtype=string),
        'choice_B': Text(shape=(), dtype=string),
        'choice_C': Text(shape=(), dtype=string),
        'choice_D': Text(shape=(), dtype=string),
        'stem': Text(shape=(), dtype=string),
    }),
    'turkIdAnonymized': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
klucz odpowiedzi Etykieta klasy int64
przejrzystość Napinacz pływak32
fakt1 Tekst strunowy
wynik ludzki Napinacz pływak32
pytanie FunkcjeDict
pytanie/wybór_A Tekst strunowy
pytanie/wybór_B Tekst strunowy
pytanie/wybór_C Tekst strunowy
pytanie/wybór_D Tekst strunowy
pytanie / rdzeń Tekst strunowy
turkIdAnonimowe Tekst strunowy
  • Cytat :
@article{mihaylov2018can,
  title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal={arXiv preprint arXiv:1809.02789},
  year={2018}
}