celah

  • Deskripsi :

GAP adalah kumpulan data seimbang gender yang berisi 8.908 pasangan berlabel koreferensi (kata ganti ambigu, nama anteseden), diambil sampelnya dari Wikipedia dan dirilis oleh Google AI Language untuk evaluasi resolusi koreferensi dalam aplikasi praktis.

Membelah Contoh
'test' 2.000
'train' 2.000
'validation' 454
  • Struktur fitur :
FeaturesDict({
    'A': Text(shape=(), dtype=tf.string),
    'A-coref': tf.bool,
    'A-offset': tf.int32,
    'B': Text(shape=(), dtype=tf.string),
    'B-coref': tf.bool,
    'B-offset': tf.int32,
    'ID': Text(shape=(), dtype=tf.string),
    'Pronoun': Text(shape=(), dtype=tf.string),
    'Pronoun-offset': tf.int32,
    'Text': Text(shape=(), dtype=tf.string),
    'URL': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
FiturDict
SEBUAH Teks tf.string
inti-A Tensor tf.bool
A-offset Tensor tf.int32
B Teks tf.string
B-coref Tensor tf.bool
B-offset Tensor tf.int32
pengenal Teks tf.string
Kata ganti Teks tf.string
Offset kata ganti Tensor tf.int32
Teks Teks tf.string
URL Teks tf.string
  • kutipan :
@article{DBLP:journals/corr/abs-1810-05201,
  author    = {Kellie Webster and
               Marta Recasens and
               Vera Axelrod and
               Jason Baldridge},
  title     = {Mind the {GAP:} {A} Balanced Corpus of Gendered Ambiguous Pronouns},
  journal   = {CoRR},
  volume    = {abs/1810.05201},
  year      = {2018},
  url       = {http://arxiv.org/abs/1810.05201},
  archivePrefix = {arXiv},
  eprint    = {1810.05201},
  timestamp = {Tue, 30 Oct 2018 20:39:56 +0100},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1810-05201},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}