- Deskripsi :
Ada dua sub dataset:
(1) RottenTomatoes: Kritikus film dan konsensus dirayapi dari http://rottentomatoes.com/ Ini memiliki bidang "_movie_name", "_movie_id", "_critics", dan "_critic_consensus".
(2) IDebate: Argumen dirayapi dari http://idebate.org/ Ini memiliki bidang "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences".
Lihat juga https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt
Kode sumber :
tfds.datasets.opinion_abstracts.BuilderVersi :
-
1.0.0(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
20.08 MiBDi-cache otomatis ( dokumentasi ): Ya
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
opini_abstrak/rotten_tomatoes (konfigurasi default)
Deskripsi konfigurasi : Kritikus profesional dan konsensus dari 3.731 film.
Ukuran dataset :
50.10 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'train' | 3.731 |
- Struktur fitur :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| _kritik_konsensus | Tensor | rangkaian | ||
| _kritik | Urutan | |||
| _kritik/kunci | Tensor | rangkaian | ||
| _kritik/nilai | Tensor | rangkaian | ||
| _movie_id | Tensor | rangkaian | ||
| _nama_film | Tensor | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('_critics', '_critic_consensus')Contoh ( tfds.as_dataframe ):
opini_abstrak/idebate
Deskripsi konfigurasi : 2.259 klaim untuk 676 debat.
Ukuran dataset :
3.15 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'train' | 2.259 |
- Struktur fitur :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| _argumen_kalimat | Urutan | |||
| _argument_kalimat/kunci | Tensor | rangkaian | ||
| _argumen_kalimat/nilai | Tensor | rangkaian | ||
| _mengeklaim | Tensor | rangkaian | ||
| _claim_id | Tensor | rangkaian | ||
| _nama_debat | Tensor | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('_argument_sentences', '_claim')Contoh ( tfds.as_dataframe ):