نظرات_چکیده ها

توضیحات :

دو زیر مجموعه داده وجود دارد:

(1) RottenTomatoes: منتقدان و اجماع فیلم از http://rottentomatoes.com/ خزیده شد و دارای فیلدهای «_movie_name»، «_movie_id»، «_critics» و «_critic_consensus» است.

(2) IDebate: آرگومان های خزیده شده از http://idebate.org/ دارای فیلدهای "_debate_name"، "_debate_id"، "_claim"، "_claim_id"، "_argument_sentences" است.

همچنین به https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt مراجعه کنید

صفحه اصلی : https://web.eecs.umich.edu/~wangluxy/data.html
کد منبع : tfds.datasets.opinion_abstracts.Builder
نسخه ها :
- 1.0.0 (پیش فرض): بدون یادداشت انتشار.
حجم دانلود : 20.08 MiB
ذخیره خودکار ( اسناد ): بله
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :

@inproceedings{wang-ling-2016-neural,
    title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
    author = "Wang, Lu  and
      Ling, Wang",
    booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
    month = jun,
    year = "2016",
    address = "San Diego, California",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/N16-1007",
    doi = "10.18653/v1/N16-1007",
    pages = "47--57",
}

opinion_abstracts/rotten_tomatoes (پیکربندی پیش فرض)

توضیحات پیکربندی : منتقدان حرفه ای و اجماع 3731 فیلم.
حجم مجموعه داده : 50.10 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	3731

ساختار ویژگی :

FeaturesDict({
    '_critic_consensus': string,
    '_critics': Sequence({
        'key': string,
        'value': string,
    }),
    '_movie_id': string,
    '_movie_name': string,
})

مستندات ویژگی :

ویژگی	کلاس	نوع D
	FeaturesDict
اجماع_نقد	تانسور	رشته
_منتقدین	توالی
_منتقد/کلید	تانسور	رشته
_منتقد/ارزش	تانسور	رشته
_id_movie	تانسور	رشته
_نام_فیلم	تانسور	رشته

کلیدهای نظارت شده ( به عنوان_سند as_supervised مراجعه کنید): ('_critics', '_critic_consensus')
مثال‌ها ( tfds.as_dataframe ):

نظر_چکیده/ایده

توضیحات پیکربندی : 2259 ادعا برای 676 مناظره.
حجم مجموعه داده : 3.15 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	2259

ساختار ویژگی :

FeaturesDict({
    '_argument_sentences': Sequence({
        'key': string,
        'value': string,
    }),
    '_claim': string,
    '_claim_id': string,
    '_debate_name': string,
})

مستندات ویژگی :

ویژگی	کلاس	نوع D
	FeaturesDict
_جملات_استدلالی	توالی
_جملات_استدلالی/کلید	تانسور	رشته
جملات_استدلالی/ارزش	تانسور	رشته
_مطالبه	تانسور	رشته
_ادعای_شناسه	تانسور	رشته
_مناظره_نام	تانسور	رشته

کلیدهای نظارت شده ( به عنوان_سند as_supervised مراجعه کنید): ('_argument_sentences', '_claim')
مثال‌ها ( tfds.as_dataframe ):

نظرات_چکیده ها با مجموعه‌ها، منظم بمانید ذخیره و طبقه‌بندی محتوا براساس اولویت‌های شما.

opinion_abstracts/rotten_tomatoes (پیکربندی پیش فرض)

نظر_چکیده/ایده

نظرات_چکیده ها