- Deskripsi :
GAP adalah kumpulan data seimbang gender yang berisi 8.908 pasangan berlabel koreferensi (kata ganti ambigu, nama anteseden), diambil sampelnya dari Wikipedia dan dirilis oleh Google AI Language untuk evaluasi resolusi koreferensi dalam aplikasi praktis.
Beranda : https://github.com/google-research-datasets/gap-coreference
Kode sumber :
tfds.text.Gap
Versi :
-
0.1.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
2.29 MiB
Ukuran kumpulan data :
Unknown size
Cache otomatis ( dokumentasi ): Tidak diketahui
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 2.000 |
'train' | 2.000 |
'validation' | 454 |
- Struktur fitur :
FeaturesDict({
'A': Text(shape=(), dtype=tf.string),
'A-coref': tf.bool,
'A-offset': tf.int32,
'B': Text(shape=(), dtype=tf.string),
'B-coref': tf.bool,
'B-offset': tf.int32,
'ID': Text(shape=(), dtype=tf.string),
'Pronoun': Text(shape=(), dtype=tf.string),
'Pronoun-offset': tf.int32,
'Text': Text(shape=(), dtype=tf.string),
'URL': Text(shape=(), dtype=tf.string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
SEBUAH | Teks | tf.string | ||
inti-A | Tensor | tf.bool | ||
A-offset | Tensor | tf.int32 | ||
B | Teks | tf.string | ||
B-coref | Tensor | tf.bool | ||
B-offset | Tensor | tf.int32 | ||
pengenal | Teks | tf.string | ||
Kata ganti | Teks | tf.string | ||
Offset kata ganti | Tensor | tf.int32 | ||
Teks | Teks | tf.string | ||
URL | Teks | tf.string |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- kutipan :
@article{DBLP:journals/corr/abs-1810-05201,
author = {Kellie Webster and
Marta Recasens and
Vera Axelrod and
Jason Baldridge},
title = {Mind the {GAP:} {A} Balanced Corpus of Gendered Ambiguous Pronouns},
journal = {CoRR},
volume = {abs/1810.05201},
year = {2018},
url = {http://arxiv.org/abs/1810.05201},
archivePrefix = {arXiv},
eprint = {1810.05201},
timestamp = {Tue, 30 Oct 2018 20:39:56 +0100},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1810-05201},
bibsource = {dblp computer science bibliography, https://dblp.org}
}