- توضیحات :
دو زیر مجموعه داده وجود دارد:
(1) RottenTomatoes: منتقدان و اجماع فیلم از http://rottentomatoes.com/ خزیده شد و دارای فیلدهای «_movie_name»، «_movie_id»، «_critics» و «_critic_consensus» است.
(2) IDebate: آرگومان های خزیده شده از http://idebate.org/ دارای فیلدهای "_debate_name"، "_debate_id"، "_claim"، "_claim_id"، "_argument_sentences" است.
همچنین به https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt مراجعه کنید
صفحه اصلی : https://web.eecs.umich.edu/~wangluxy/data.html
کد منبع :
tfds.datasets.opinion_abstracts.Builder
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
20.08 MiB
ذخیره خودکار ( اسناد ): بله
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
opinion_abstracts/rotten_tomatoes (پیکربندی پیش فرض)
توضیحات پیکربندی : منتقدان حرفه ای و اجماع 3731 فیلم.
حجم مجموعه داده :
50.10 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 3731 |
- ساختار ویژگی :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
اجماع_نقد | تانسور | رشته | ||
_منتقدین | توالی | |||
_منتقد/کلید | تانسور | رشته | ||
_منتقد/ارزش | تانسور | رشته | ||
_id_movie | تانسور | رشته | ||
_نام_فیلم | تانسور | رشته |
کلیدهای نظارت شده ( به عنوان_سند
as_supervised
مراجعه کنید):('_critics', '_critic_consensus')
مثالها ( tfds.as_dataframe ):
نظر_چکیده/ایده
توضیحات پیکربندی : 2259 ادعا برای 676 مناظره.
حجم مجموعه داده :
3.15 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 2259 |
- ساختار ویژگی :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
_جملات_استدلالی | توالی | |||
_جملات_استدلالی/کلید | تانسور | رشته | ||
جملات_استدلالی/ارزش | تانسور | رشته | ||
_مطالبه | تانسور | رشته | ||
_ادعای_شناسه | تانسور | رشته | ||
_مناظره_نام | تانسور | رشته |
کلیدهای نظارت شده ( به عنوان_سند
as_supervised
مراجعه کنید):('_argument_sentences', '_claim')
مثالها ( tfds.as_dataframe ):