- Deskripsi :
Set Data Opini Opini terdiri dari kalimat yang diambil dari ulasan untuk 51 topik. Topik dan opini diperoleh dari Tripadvisor, Edmunds.com, dan Amazon.com.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : http://kavita-ganesan.com/opinosis/
Kode sumber :
tfds.datasets.opinosis.BuilderVersi :
-
1.0.0(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
739.65 KiBUkuran dataset :
725.45 KiBDi-cache otomatis ( dokumentasi ): Ya
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 51 |
- Struktur fitur :
FeaturesDict({
'review_sents': Text(shape=(), dtype=string),
'summaries': Sequence(Text(shape=(), dtype=string)),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| review_kirim | Teks | rangkaian | ||
| ringkasan | Urutan (Teks) | (Tidak ada,) | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('review_sents', 'summaries')Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{ganesan2010opinosis,
title={Opinosis: a graph-based approach to abstractive summarization of highly redundant opinions},
author={Ganesan, Kavita and Zhai, ChengXiang and Han, Jiawei},
booktitle={Proceedings of the 23rd International Conference on Computational Linguistics},
pages={340--348},
year={2010},
organization={Association for Computational Linguistics}
}