अन्तर

  • विवरण :

GAP एक लिंग-संतुलित डेटासेट है जिसमें 8,908 कोरफेरेंस-लेबल जोड़े (अस्पष्ट सर्वनाम, पूर्ववर्ती नाम) शामिल हैं, जिन्हें विकिपीडिया से नमूना लिया गया है और व्यावहारिक अनुप्रयोगों में कोरफेरेंस रिज़ॉल्यूशन के मूल्यांकन के लिए Google AI भाषा द्वारा जारी किया गया है।

विभाजित करना उदाहरण
'test' 2,000
'train' 2,000
'validation' 454
  • फ़ीचर संरचना :
FeaturesDict({
    'A': Text(shape=(), dtype=tf.string),
    'A-coref': tf.bool,
    'A-offset': tf.int32,
    'B': Text(shape=(), dtype=tf.string),
    'B-coref': tf.bool,
    'B-offset': tf.int32,
    'ID': Text(shape=(), dtype=tf.string),
    'Pronoun': Text(shape=(), dtype=tf.string),
    'Pronoun-offset': tf.int32,
    'Text': Text(shape=(), dtype=tf.string),
    'URL': Text(shape=(), dtype=tf.string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएंडिक्ट
मूलपाठ tf.स्ट्रिंग
ए-कोरफ टेन्सर tf.बूल
ए-ऑफ़सेट टेन्सर tf.int32
बी मूलपाठ tf.स्ट्रिंग
बी-कोरफ टेन्सर tf.बूल
बी-ऑफ़सेट टेन्सर tf.int32
पहचान मूलपाठ tf.स्ट्रिंग
सवर्नाम मूलपाठ tf.स्ट्रिंग
सर्वनाम ऑफसेट टेन्सर tf.int32
मूलपाठ मूलपाठ tf.स्ट्रिंग
यूआरएल मूलपाठ tf.स्ट्रिंग
  • उद्धरण :
@article{DBLP:journals/corr/abs-1810-05201,
  author    = {Kellie Webster and
               Marta Recasens and
               Vera Axelrod and
               Jason Baldridge},
  title     = {Mind the {GAP:} {A} Balanced Corpus of Gendered Ambiguous Pronouns},
  journal   = {CoRR},
  volume    = {abs/1810.05201},
  year      = {2018},
  url       = {http://arxiv.org/abs/1810.05201},
  archivePrefix = {arXiv},
  eprint    = {1810.05201},
  timestamp = {Tue, 30 Oct 2018 20:39:56 +0100},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1810-05201},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}