określone_zaimek_rozdzielczość

  • opis :

Utwór skomponowany przez 30 studentów jednej z autorskich klas licencjackich. Te pary zdań obejmują różne tematy, od rzeczywistych wydarzeń (np. plan Iranu ataku na ambasadora Arabii Saudyjskiej w USA) po wydarzenia/postacie z filmów (np. Batman) i czysto wyimaginowane sytuacje, w dużej mierze odzwierciedlające popkulturę postrzeganą przez amerykańskie dzieci urodzony na początku lat 90. Każdy przykład z adnotacjami obejmuje cztery wiersze: pierwszy wiersz zawiera zdanie, drugi zawiera zaimek docelowy, trzeci wiersz zawiera dwa kandydujące poprzedniki, a czwarty wiersz zawiera poprawny poprzednik. Jeśli zaimek docelowy pojawia się w zdaniu więcej niż raz, jego pierwsze wystąpienie jest tym, które ma zostać rozwiązane.

Podział Przykłady
'test' 564
'train' 1322
  • Struktura funkcji :
FeaturesDict({
   
'candidates': Sequence(Text(shape=(), dtype=string)),
   
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
   
'pronoun': Text(shape=(), dtype=string),
   
'sentence': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
kandydaci Sekwencja (tekst) (2,) strunowy
etykieta Etykieta klasy int64
zaimek Tekst strunowy
zdanie Tekst strunowy
  • Cytat :
@inproceedings{rahman2012resolving,
  title
={Resolving complex cases of definite pronouns: the winograd schema challenge},
  author
={Rahman, Altaf and Ng, Vincent},
  booktitle
={Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning},
  pages
={777--789},
  year
={2012},
  organization
={Association for Computational Linguistics}
}