- الوصف :
تتكون مجموعة بيانات الرأي من جمل مستخرجة من مراجعات لـ 51 موضوعًا. يتم الحصول على الموضوعات والآراء من Tripadvisor و Edmunds.com و Amazon.com.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : http://kavita-ganesan.com/opinosis/
كود المصدر :
tfds.datasets.opinosis.Builderإصدارات :
-
1.0.0(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
739.65 KiBحجم مجموعة البيانات :
725.45 KiBالتخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 51 |
- هيكل الميزة :
FeaturesDict({
'review_sents': Text(shape=(), dtype=string),
'summaries': Sequence(Text(shape=(), dtype=string)),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| الميزات | ||||
| review_sents | نص | سلسلة | ||
| الملخصات | تسلسل (نص) | (لا أحد،) | سلسلة |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised):('review_sents', 'summaries')الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{ganesan2010opinosis,
title={Opinosis: a graph-based approach to abstractive summarization of highly redundant opinions},
author={Ganesan, Kavita and Zhai, ChengXiang and Han, Jiawei},
booktitle={Proceedings of the 23rd International Conference on Computational Linguistics},
pages={340--348},
year={2010},
organization={Association for Computational Linguistics}
}