- Описание :
Есть два поднабора данных:
(1) RottenTomatoes: Кинокритики и консенсус, взятые с сайта http://rottentomatoes.com/ , содержат поля «_movie_name», «_movie_id», «_critics» и «_critic_consensus».
(2) IDebate: Аргументы, просканированные с http://idebate.org/ , содержат поля «_debate_name», «_debate_id», «_claim», «_claim_id», «_argument_sentences».
См. также https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt
Домашняя страница : https://web.eecs.umich.edu/~wangluxy/data.html
Исходный код :
tfds.datasets.opinion_abstracts.BuilderВерсии :
-
1.0.0(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
20.08 MiBАвтоматическое кэширование ( документация ): Да
Рисунок ( tfds.show_examples ): не поддерживается.
Цитата :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
mind_abstracts/rotten_tomatoes (конфигурация по умолчанию)
Описание конфигурации : Профессиональные критики и консенсус 3731 фильма.
Размер набора данных :
50.10 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'train' | 3731 |
- Структура функции :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| ОсобенностиDict | ||||
| _critic_consensus | Тензор | нить | ||
| _критики | Последовательность | |||
| _критики/ключ | Тензор | нить | ||
| _критики/значение | Тензор | нить | ||
| _movie_id | Тензор | нить | ||
| _movie_name | Тензор | нить |
Контролируемые ключи (см. документ
as_supervised):('_critics', '_critic_consensus')Примеры ( tfds.as_dataframe ):
mind_abstracts/idebate
Описание конфига : 2259 заявок на 676 дебатов.
Размер набора данных :
3.15 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'train' | 2259 |
- Структура функции :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| ОсобенностиDict | ||||
| _argument_sentences | Последовательность | |||
| _argument_sentences/ключ | Тензор | нить | ||
| _argument_sentences/значение | Тензор | нить | ||
| _требовать | Тензор | нить | ||
| _claim_id | Тензор | нить | ||
| _debate_name | Тензор | нить |
Контролируемые ключи (см. документ
as_supervised):('_argument_sentences', '_claim')Примеры ( tfds.as_dataframe ):