ফাঁক

  • বর্ণনা :

GAP হল একটি লিঙ্গ-ভারসাম্যযুক্ত ডেটাসেট যাতে 8,908টি কোরেফারেন্স-লেবেলযুক্ত জোড়া (অস্পষ্ট সর্বনাম, পূর্ববর্তী নাম), উইকিপিডিয়া থেকে নমুনা নেওয়া হয় এবং ব্যবহারিক অ্যাপ্লিকেশনগুলিতে কোরফারেন্স রেজোলিউশনের মূল্যায়নের জন্য Google AI ল্যাঙ্গুয়েজ দ্বারা প্রকাশ করা হয়।

বিভক্ত উদাহরণ
'test' 2,000
'train' 2,000
'validation' 454
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'A': Text(shape=(), dtype=tf.string),
    'A-coref': tf.bool,
    'A-offset': tf.int32,
    'B': Text(shape=(), dtype=tf.string),
    'B-coref': tf.bool,
    'B-offset': tf.int32,
    'ID': Text(shape=(), dtype=tf.string),
    'Pronoun': Text(shape=(), dtype=tf.string),
    'Pronoun-offset': tf.int32,
    'Text': Text(shape=(), dtype=tf.string),
    'URL': Text(shape=(), dtype=tf.string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পাঠ্য tf.string
এ-কোরফ টেনসর tf.bool
এ-অফসেট টেনসর tf.int32
পাঠ্য tf.string
বি-কোরফ টেনসর tf.bool
বি-অফসেট টেনসর tf.int32
আইডি পাঠ্য tf.string
সর্বনাম পাঠ্য tf.string
সর্বনাম-অফসেট টেনসর tf.int32
পাঠ্য পাঠ্য tf.string
URL পাঠ্য tf.string
  • উদ্ধৃতি :
@article{DBLP:journals/corr/abs-1810-05201,
  author    = {Kellie Webster and
               Marta Recasens and
               Vera Axelrod and
               Jason Baldridge},
  title     = {Mind the {GAP:} {A} Balanced Corpus of Gendered Ambiguous Pronouns},
  journal   = {CoRR},
  volume    = {abs/1810.05201},
  year      = {2018},
  url       = {http://arxiv.org/abs/1810.05201},
  archivePrefix = {arXiv},
  eprint    = {1810.05201},
  timestamp = {Tue, 30 Oct 2018 20:39:56 +0100},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1810-05201},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}