celah

  • Deskripsi :

GAP adalah kumpulan data seimbang gender yang berisi 8.908 pasangan berlabel koreferensi (kata ganti ambigu, nama anteseden), diambil sampelnya dari Wikipedia dan dirilis oleh Google AI Language untuk evaluasi resolusi koreferensi dalam aplikasi praktis.

Membelah Contoh
'test' 2.000
'train' 2.000
'validation' 454
  • Struktur fitur :
FeaturesDict({
    'A': Text(shape=(), dtype=string),
    'A-coref': bool,
    'A-offset': int32,
    'B': Text(shape=(), dtype=string),
    'B-coref': bool,
    'B-offset': int32,
    'ID': Text(shape=(), dtype=string),
    'Pronoun': Text(shape=(), dtype=string),
    'Pronoun-offset': int32,
    'Text': Text(shape=(), dtype=string),
    'URL': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
SEBUAH Teks rangkaian
A-coref Tensor bool
A-offset Tensor int32
B Teks rangkaian
B-coref Tensor bool
B-offset Tensor int32
PENGENAL Teks rangkaian
Kata ganti Teks rangkaian
Kata ganti-offset Tensor int32
Teks Teks rangkaian
URL Teks rangkaian
  • Kutipan :
@article{DBLP:journals/corr/abs-1810-05201,
  author    = {Kellie Webster and
               Marta Recasens and
               Vera Axelrod and
               Jason Baldridge},
  title     = {Mind the {GAP:} {A} Balanced Corpus of Gendered Ambiguous Pronouns},
  journal   = {CoRR},
  volume    = {abs/1810.05201},
  year      = {2018},
  url       = {http://arxiv.org/abs/1810.05201},
  archivePrefix = {arXiv},
  eprint    = {1810.05201},
  timestamp = {Tue, 30 Oct 2018 20:39:56 +0100},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1810-05201},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}