- Mô tả :
Bộ dữ liệu ý kiến Opinosis bao gồm các câu được trích xuất từ các bài đánh giá cho 51 chủ đề. Các chủ đề và ý kiến được lấy từ Tripadvisor, Edmunds.com và Amazon.com.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : http://kavita-ganesan.com/opinosis/
Mã nguồn :
tfds.datasets.opinosis.Builder
Phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
739.65 KiB
Kích thước tập dữ liệu :
725.45 KiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 51 |
- Cấu trúc tính năng :
FeaturesDict({
'review_sents': Text(shape=(), dtype=string),
'summaries': Sequence(Text(shape=(), dtype=string)),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
đánh giá_đã gửi | Chữ | sợi dây | ||
tóm tắt | Trình tự (Văn bản) | (Không có,) | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):('review_sents', 'summaries')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@inproceedings{ganesan2010opinosis,
title={Opinosis: a graph-based approach to abstractive summarization of highly redundant opinions},
author={Ganesan, Kavita and Zhai, ChengXiang and Han, Jiawei},
booktitle={Proceedings of the 23rd International Conference on Computational Linguistics},
pages={340--348},
year={2010},
organization={Association for Computational Linguistics}
}