- Açıklama :
İki alt veri kümesi vardır:
(1) RottenTomatoes: http://rottentomatoes.com/ adresinden taranan film eleştirmenleri ve fikir birliği "_movie_name", "_movie_id", "_critics" ve "_critic_consensus" alanlarına sahiptir.
(2) IDebate: http://idebate.org/ adresinden taranan argümanlar "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences" alanlarına sahiptir.
Ayrıca bkz. https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt
Ana sayfa : https://web.eecs.umich.edu/~wangluxy/data.html
Kaynak kodu :
tfds.datasets.opinion_abstracts.Buildersürümler :
-
1.0.0(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
20.08 MiBOtomatik önbelleğe alınmış ( belgeleme ): Evet
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
görüş_abstracts/rotten_tomatoes (varsayılan yapılandırma)
Yapılandırma açıklaması : 3.731 filmin profesyonel eleştirmenleri ve fikir birliği.
Veri kümesi boyutu :
50.10 MiBbölmeler :
| Bölmek | örnekler |
|---|---|
'train' | 3.731 |
- Özellik yapısı :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Tanım |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| _critic_consensus | tensör | sicim | ||
| _eleştirmenler | Sekans | |||
| _eleştirmenler/anahtar | tensör | sicim | ||
| _eleştirmenler/değer | tensör | sicim | ||
| _film_kimliği | tensör | sicim | ||
| _film_adı | tensör | sicim |
Denetimli anahtarlar (Bkz.
as_superviseddoc ):('_critics', '_critic_consensus')Örnekler ( tfds.as_dataframe ):
görüş_özetleri/idebate
Yapılandırma açıklaması : 676 tartışma için 2.259 hak talebi.
Veri kümesi boyutu :
3.15 MiBbölmeler :
| Bölmek | örnekler |
|---|---|
'train' | 2.259 |
- Özellik yapısı :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Tanım |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| _argument_sentences | Sekans | |||
| _argument_sentences/anahtar | tensör | sicim | ||
| _argument_sentences/değer | tensör | sicim | ||
| _iddia | tensör | sicim | ||
| _claim_id | tensör | sicim | ||
| _tartışma_adı | tensör | sicim |
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('_argument_sentences', '_claim')Örnekler ( tfds.as_dataframe ):