ফাঁক

  • বর্ণনা :

GAP হল একটি লিঙ্গ-ভারসাম্যযুক্ত ডেটাসেট যাতে 8,908টি কোরেফারেন্স-লেবেলযুক্ত জোড়া (অস্পষ্ট সর্বনাম, পূর্ববর্তী নাম), উইকিপিডিয়া থেকে নমুনা নেওয়া হয় এবং ব্যবহারিক অ্যাপ্লিকেশনগুলিতে কোরফারেন্স রেজোলিউশনের মূল্যায়নের জন্য Google AI ল্যাঙ্গুয়েজ দ্বারা প্রকাশ করা হয়।

বিভক্ত উদাহরণ
'test' 2,000
'train' 2,000
'validation' 454
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
   
'A': Text(shape=(), dtype=string),
   
'A-coref': bool,
   
'A-offset': int32,
   
'B': Text(shape=(), dtype=string),
   
'B-coref': bool,
   
'B-offset': int32,
   
'ID': Text(shape=(), dtype=string),
   
'Pronoun': Text(shape=(), dtype=string),
   
'Pronoun-offset': int32,
   
'Text': Text(shape=(), dtype=string),
   
'URL': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পাঠ্য স্ট্রিং
এ-কোরফ টেনসর bool
এ-অফসেট টেনসর int32
পাঠ্য স্ট্রিং
বি-কোরফ টেনসর bool
বি-অফসেট টেনসর int32
আইডি পাঠ্য স্ট্রিং
সর্বনাম পাঠ্য স্ট্রিং
সর্বনাম-অফসেট টেনসর int32
পাঠ্য পাঠ্য স্ট্রিং
URL পাঠ্য স্ট্রিং
  • উদ্ধৃতি :
@article{DBLP:journals/corr/abs-1810-05201,
  author    
= {Kellie Webster and
               
Marta Recasens and
               
Vera Axelrod and
               
Jason Baldridge},
  title    
= {Mind the {GAP:} {A} Balanced Corpus of Gendered Ambiguous Pronouns},
  journal  
= {CoRR},
  volume    
= {abs/1810.05201},
  year      
= {2018},
  url      
= {http://arxiv.org/abs/1810.05201},
  archivePrefix
= {arXiv},
  eprint    
= {1810.05201},
  timestamp
= {Tue, 30 Oct 2018 20:39:56 +0100},
  biburl    
= {https://dblp.org/rec/bib/journals/corr/abs-1810-05201},
  bibsource
= {dblp computer science bibliography, https://dblp.org}
}