açıklık

  • Açıklama :

GAP, Wikipedia'dan örneklenen ve pratik uygulamalarda bağıntı çözünürlüğünün değerlendirilmesi için Google AI Language tarafından yayınlanan 8.908 bağıntı etiketli çift (belirsiz zamir, öncül ad) içeren, cinsiyet dengeli bir veri kümesidir.

Bölmek örnekler
'test' 2.000
'train' 2.000
'validation' 454
  • Özellik yapısı :
FeaturesDict({
    'A': Text(shape=(), dtype=string),
    'A-coref': bool,
    'A-offset': int32,
    'B': Text(shape=(), dtype=string),
    'B-coref': bool,
    'B-offset': int32,
    'ID': Text(shape=(), dtype=string),
    'Pronoun': Text(shape=(), dtype=string),
    'Pronoun-offset': int32,
    'Text': Text(shape=(), dtype=string),
    'URL': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Açıklama
ÖzelliklerDict
A Metin sicim
A-coref tensör bool
A ofseti tensör int32
B Metin sicim
B-coref tensör bool
B-ofset tensör int32
İD Metin sicim
zamir Metin sicim
zamir ofseti tensör int32
Metin Metin sicim
URL Metin sicim
  • Alıntı :
@article{DBLP:journals/corr/abs-1810-05201,
  author    = {Kellie Webster and
               Marta Recasens and
               Vera Axelrod and
               Jason Baldridge},
  title     = {Mind the {GAP:} {A} Balanced Corpus of Gendered Ambiguous Pronouns},
  journal   = {CoRR},
  volume    = {abs/1810.05201},
  year      = {2018},
  url       = {http://arxiv.org/abs/1810.05201},
  archivePrefix = {arXiv},
  eprint    = {1810.05201},
  timestamp = {Tue, 30 Oct 2018 20:39:56 +0100},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1810-05201},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}