answer_equivalence

 • opis :

Zbiór danych równoważności odpowiedzi zawiera oceny ludzi dotyczące przewidywań modeli z kilku modeli w zbiorze danych SQuAD. Oceny określają, czy przewidywana odpowiedź jest „równoważna” złotej odpowiedzi (biorąc pod uwagę zarówno pytanie, jak i kontekst).

Mówiąc dokładniej, przez „odpowiednik” rozumiemy, że przewidywana odpowiedź zawiera co najmniej te same informacje, co złota odpowiedź i nie dodaje zbędnych informacji. Zbiór danych zawiera adnotacje dla: * prognoz z BiDAF na SQuAD dev * prognoz z XLNet na SQuAD dev * prognoz z Luke'a na SQuAD dev * prognoz z Alberta na SQuAD szkolenia, deweloperzy i przykłady testów

Rozdzielać Przykłady
'ae_dev' 4446
'ae_test' 9724
'dev_bidaf' 7522
'dev_luke' 4590
'dev_xlnet' 7932
'train' 9090
 • Struktura funkcji :
FeaturesDict({
  'candidate': Text(shape=(), dtype=string),
  'context': Text(shape=(), dtype=string),
  'gold_index': int32,
  'qid': Text(shape=(), dtype=string),
  'question': Text(shape=(), dtype=string),
  'question_1': ClassLabel(shape=(), dtype=int64, num_classes=3),
  'question_2': ClassLabel(shape=(), dtype=int64, num_classes=3),
  'question_3': ClassLabel(shape=(), dtype=int64, num_classes=3),
  'question_4': ClassLabel(shape=(), dtype=int64, num_classes=3),
  'reference': Text(shape=(), dtype=string),
  'score': float32,
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
kandydat Tekst strunowy
kontekst Tekst strunowy
złoty_indeks Napinacz int32
qid Tekst strunowy
pytanie Tekst strunowy
Pytanie 1 Etykieta klasy int64
pytanie 2 Etykieta klasy int64
pytanie 3 Etykieta klasy int64
pytanie_4 Etykieta klasy int64
odniesienie Tekst strunowy
wynik Napinacz pływak32
 • Cytat :
@article{bulian-etal-2022-tomayto,
   title={Tomayto, Tomahto. Beyond Token-level Answer Equivalence for Question Answering Evaluation},
   author={Jannis Bulian and Christian Buck and Wojciech Gajewski and Benjamin Boerschinger and Tal Schuster},
   year={2022},
   eprint={2202.07654},
   archivePrefix={arXiv},
   primaryClass={cs.CL}
}