- opis :
Istnieją dwa podzbiory danych:
(1) RottenTomatoes: Krytycy filmowi i konsensus przeszukali stronę http://rottentomatoes.com/ Zawiera pola „_movie_name”, „_movie_id”, „_critics” i „_critic_consensus”.
(2) IDebate: Argumenty przeszukane z http://idebate.org/ Ma pola „_debate_name”, „_debate_id”, „_claim”, „_claim_id”, „_argument_sentences”.
Zobacz także https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt
Strona główna : https://web.eecs.umich.edu/~wangluxy/data.html
Kod źródłowy :
tfds.datasets.opinion_abstracts.Builder
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
20.08 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
streszczenia_opinii/zgniłe_pomidory (domyślna konfiguracja)
Opis konfiguracji : Profesjonalni krytycy i konsensus co do 3731 filmów.
Rozmiar zestawu danych :
50.10 MiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 3731 |
- Struktura funkcji :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
_krytyka_konsensus | Napinacz | strunowy | ||
_krytycy | Sekwencja | |||
_krytycy/klucz | Napinacz | strunowy | ||
_krytycy/wartość | Napinacz | strunowy | ||
_identyfikator_filmu | Napinacz | strunowy | ||
_nazwa_filmu | Napinacz | strunowy |
Nadzorowane klucze (patrz
as_supervised
doc ):('_critics', '_critic_consensus')
Przykłady ( tfds.as_dataframe ):
opinie_streszczenia/idebate
Opis konfiguracji : 2259 zgłoszeń na 676 debat.
Rozmiar zestawu danych :
3.15 MiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 2259 |
- Struktura funkcji :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
_argument_zdania | Sekwencja | |||
_argument_zdania/klucz | Napinacz | strunowy | ||
_argument_zdania/wartość | Napinacz | strunowy | ||
_prawo | Napinacz | strunowy | ||
_identyfikator_roszczenia | Napinacz | strunowy | ||
_nazwa_debaty | Napinacz | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised
):('_argument_sentences', '_claim')
Przykłady ( tfds.as_dataframe ):