- Описание :
Набор данных Opinosis Opinion состоит из предложений, извлеченных из обзоров по 51 теме. Темы и мнения получены с Tripadvisor, Edmunds.com и Amazon.com.
Дополнительная документация : изучить документы с кодом
Домашняя страница : http://kavita-ganesan.com/opinosis/
Исходный код :
tfds.datasets.opinosis.BuilderВерсии :
-
1.0.0(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
739.65 KiBРазмер набора данных :
725.45 KiB.Автоматическое кэширование ( документация ): Да
Сплиты :
| Расколоть | Примеры |
|---|---|
'train' | 51 |
- Структура функции :
FeaturesDict({
'review_sents': Text(shape=(), dtype=string),
'summaries': Sequence(Text(shape=(), dtype=string)),
})
- Документация по функциям :
| Особенность | Учебный класс | Форма | Dтип | Описание |
|---|---|---|---|---|
| ОсобенностиDict | ||||
| Review_sents | Текст | нить | ||
| резюме | Последовательность (текст) | (Никто,) | нить |
Контролируемые ключи (см . документ
as_supervised):('review_sents', 'summaries')Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{ganesan2010opinosis,
title={Opinosis: a graph-based approach to abstractive summarization of highly redundant opinions},
author={Ganesan, Kavita and Zhai, ChengXiang and Han, Jiawei},
booktitle={Proceedings of the 23rd International Conference on Computational Linguistics},
pages={340--348},
year={2010},
organization={Association for Computational Linguistics}
}