answer_equivalence

  • opis :

Zbiór danych równoważności odpowiedzi zawiera oceny ludzi dotyczące przewidywań modeli z kilku modeli w zbiorze danych SQuAD. Oceny określają, czy przewidywana odpowiedź jest „równoważna” złotej odpowiedzi (biorąc pod uwagę zarówno pytanie, jak i kontekst).

Mówiąc dokładniej, przez „odpowiednik” rozumiemy, że przewidywana odpowiedź zawiera co najmniej te same informacje, co złota odpowiedź i nie dodaje zbędnych informacji. Zbiór danych zawiera adnotacje dla: * prognoz z BiDAF na SQuAD dev * prognoz z XLNet na SQuAD dev * prognoz z Luke'a na SQuAD dev * prognoz z Alberta na SQuAD szkolenia, deweloperzy i przykłady testów

Rozdzielać Przykłady
'ae_dev' 4446
'ae_test' 9724
'dev_bidaf' 7522
'dev_luke' 4590
'dev_xlnet' 7932
'train' 9090
  • Struktura funkcji :
FeaturesDict({
    'candidate': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'gold_index': int32,
    'qid': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
    'question_1': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_2': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_3': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_4': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'reference': Text(shape=(), dtype=string),
    'score': float32,
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
kandydat Tekst strunowy
kontekst Tekst strunowy
złoty_indeks Napinacz int32
qid Tekst strunowy
pytanie Tekst strunowy
Pytanie 1 Etykieta klasy int64
pytanie 2 Etykieta klasy int64
pytanie 3 Etykieta klasy int64
pytanie_4 Etykieta klasy int64
odniesienie Tekst strunowy
wynik Napinacz pływak32
  • Cytat :
@article{bulian-etal-2022-tomayto,
      title={Tomayto, Tomahto. Beyond Token-level Answer Equivalence for Question Answering Evaluation},
      author={Jannis Bulian and Christian Buck and Wojciech Gajewski and Benjamin Boerschinger and Tal Schuster},
      year={2022},
      eprint={2202.07654},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}