- توضیحات :
ساخته شده توسط 30 دانشجو از یکی از کلاس های کارشناسی نویسنده. این جفت جملات موضوعاتی از رویدادهای واقعی (مثلاً برنامه ایران برای حمله به سفیر عربستان در ایالات متحده) تا رویدادها/شخصیتهای فیلمها (مثلاً بتمن) و موقعیتهای کاملاً تخیلی را پوشش میدهند که عمدتاً فرهنگ پاپ را که توسط بچههای آمریکایی درک میشود منعکس میکند. متولد اوایل دهه 90 هر مثال مشروح شامل چهار خط است: سطر اول شامل جمله، سطر دوم شامل ضمیر هدف، سطر سوم شامل دو پیشین کاندید، و سطر چهارم حاوی مقدمه صحیح است. اگر ضمیر هدف بیش از یک بار در جمله ظاهر شود، اولین اتفاق آن چیزی است که باید حل شود.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://www.hlt.utdallas.edu/~vince/data/emnlp12/
کد منبع :
tfds.text.DefinitePronounResolution
نسخه ها :
-
1.1.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
222.12 KiB
حجم مجموعه داده :
334.22 KiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 564 |
'train' | 1,322 |
- ساختار ویژگی :
FeaturesDict({
'candidates': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'pronoun': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
نامزدهای | دنباله (متن) | (2،) | رشته | |
برچسب | ClassLabel | int64 | ||
ضمیر | متن | رشته | ||
جمله | متن | رشته |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):('sentence', 'label')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{rahman2012resolving,
title={Resolving complex cases of definite pronouns: the winograd schema challenge},
author={Rahman, Altaf and Ng, Vincent},
booktitle={Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning},
pages={777--789},
year={2012},
organization={Association for Computational Linguistics}
}