- विवरण :
ओपिनोसिस ओपिनियन डेटासेट में 51 विषयों के लिए समीक्षाओं से निकाले गए वाक्य शामिल हैं। विषय और राय Tripadvisor, Edmunds.com और Amazon.com से प्राप्त की जाती हैं।
अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
होमपेज : http://kavita-ganesan.com/opinosis/
स्रोत कोड :
tfds.datasets.opinosis.Builderसंस्करण :
-
1.0.0(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
739.65 KiBडेटासेट का आकार :
725.45 KiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 51 |
- फ़ीचर संरचना :
FeaturesDict({
'review_sents': Text(shape=(), dtype=string),
'summaries': Sequence(Text(shape=(), dtype=string)),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| Review_sent | मूलपाठ | डोरी | ||
| सारांश | अनुक्रम (पाठ) | (कोई भी नहीं,) | डोरी |
निगरानी की गई कुंजियां (
as_supervisedदस्तावेज़ देखें):('review_sents', 'summaries')चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@inproceedings{ganesan2010opinosis,
title={Opinosis: a graph-based approach to abstractive summarization of highly redundant opinions},
author={Ganesan, Kavita and Zhai, ChengXiang and Han, Jiawei},
booktitle={Proceedings of the 23rd International Conference on Computational Linguistics},
pages={340--348},
year={2010},
organization={Association for Computational Linguistics}
}