- توضیحات :
مجموعه داده Opinosis Opinion شامل جملاتی است که از بررسی ها برای 51 موضوع استخراج شده است. موضوعات و نظرات از Tripadvisor، Edmunds.com و Amazon.com به دست آمده است.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : http://kavita-ganesan.com/opinosis/
کد منبع :
tfds.datasets.opinosis.Builder
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
739.65 KiB
اندازه مجموعه داده :
725.45 KiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 51 |
- ساختار ویژگی :
FeaturesDict({
'review_sents': Text(shape=(), dtype=string),
'summaries': Sequence(Text(shape=(), dtype=string)),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
بررسی_ارسال می کند | متن | رشته | ||
خلاصه ها | دنباله (متن) | (هیچ یک،) | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
):('review_sents', 'summaries')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{ganesan2010opinosis,
title={Opinosis: a graph-based approach to abstractive summarization of highly redundant opinions},
author={Ganesan, Kavita and Zhai, ChengXiang and Han, Jiawei},
booktitle={Proceedings of the 23rd International Conference on Computational Linguistics},
pages={340--348},
year={2010},
organization={Association for Computational Linguistics}
}