opini_abstrak

Deskripsi :

Ada dua sub dataset:

(1) RottenTomatoes: Kritikus film dan konsensus dirayapi dari http://rottentomatoes.com/ Ini memiliki bidang "_movie_name", "_movie_id", "_critics", dan "_critic_consensus".

(2) IDebate: Argumen dirayapi dari http://idebate.org/ Ini memiliki bidang "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences".

Lihat juga https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt

Beranda : https://web.eecs.umich.edu/~wangluxy/data.html
Kode sumber : tfds.datasets.opinion_abstracts.Builder
Versi :
- 1.0.0 (default): Tidak ada catatan rilis.
Ukuran unduhan : 20.08 MiB
Di-cache otomatis ( dokumentasi ): Ya
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :

@inproceedings{wang-ling-2016-neural,
    title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
    author = "Wang, Lu  and
      Ling, Wang",
    booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
    month = jun,
    year = "2016",
    address = "San Diego, California",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/N16-1007",
    doi = "10.18653/v1/N16-1007",
    pages = "47--57",
}

opini_abstrak/rotten_tomatoes (konfigurasi default)

Deskripsi konfigurasi : Kritikus profesional dan konsensus dari 3.731 film.
Ukuran dataset : 50.10 MiB
Perpecahan :

Membelah	Contoh
`'train'`	3.731

Struktur fitur :

FeaturesDict({
    '_critic_consensus': string,
    '_critics': Sequence({
        'key': string,
        'value': string,
    }),
    '_movie_id': string,
    '_movie_name': string,
})

Dokumentasi fitur :

Fitur	Kelas	Dtype
	fiturDict
_kritik_konsensus	Tensor	rangkaian
_kritik	Urutan
_kritik/kunci	Tensor	rangkaian
_kritik/nilai	Tensor	rangkaian
_movie_id	Tensor	rangkaian
_nama_film	Tensor	rangkaian

Kunci yang diawasi (Lihat as_supervised doc ): ('_critics', '_critic_consensus')
Contoh ( tfds.as_dataframe ):

opini_abstrak/idebate

Deskripsi konfigurasi : 2.259 klaim untuk 676 debat.
Ukuran dataset : 3.15 MiB
Perpecahan :

Membelah	Contoh
`'train'`	2.259

Struktur fitur :

FeaturesDict({
    '_argument_sentences': Sequence({
        'key': string,
        'value': string,
    }),
    '_claim': string,
    '_claim_id': string,
    '_debate_name': string,
})

Dokumentasi fitur :

Fitur	Kelas	Dtype
	fiturDict
_argumen_kalimat	Urutan
_argument_kalimat/kunci	Tensor	rangkaian
_argumen_kalimat/nilai	Tensor	rangkaian
_mengeklaim	Tensor	rangkaian
_claim_id	Tensor	rangkaian
_nama_debat	Tensor	rangkaian

Kunci yang diawasi (Lihat as_supervised doc ): ('_argument_sentences', '_claim')
Contoh ( tfds.as_dataframe ):

opini_abstrak Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

opini_abstrak/rotten_tomatoes (konfigurasi default)

opini_abstrak/idebate

opini_abstrak