- opis :
Istnieją dwa podzbiory danych:
(1) RottenTomatoes: Krytycy filmowi i konsensus przeszukali stronę http://rottentomatoes.com/ Zawiera pola „_movie_name”, „_movie_id”, „_critics” i „_critic_consensus”.
(2) IDebate: Argumenty przeszukane z http://idebate.org/ Ma pola „_debate_name”, „_debate_id”, „_claim”, „_claim_id”, „_argument_sentences”.
Zobacz także https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt
Strona główna : https://web.eecs.umich.edu/~wangluxy/data.html
Kod źródłowy :
tfds.datasets.opinion_abstracts.BuilderWersje :
-
1.0.0(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
20.08 MiBAutomatyczne buforowanie ( dokumentacja ): Tak
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
streszczenia_opinii/zgniłe_pomidory (domyślna konfiguracja)
Opis konfiguracji : Profesjonalni krytycy i konsensus co do 3731 filmów.
Rozmiar zestawu danych :
50.10 MiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 3731 |
- Struktura funkcji :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| _krytyka_konsensus | Napinacz | strunowy | ||
| _krytycy | Sekwencja | |||
| _krytycy/klucz | Napinacz | strunowy | ||
| _krytycy/wartość | Napinacz | strunowy | ||
| _identyfikator_filmu | Napinacz | strunowy | ||
| _nazwa_filmu | Napinacz | strunowy |
Nadzorowane klucze (patrz
as_superviseddoc ):('_critics', '_critic_consensus')Przykłady ( tfds.as_dataframe ):
opinie_streszczenia/idebate
Opis konfiguracji : 2259 zgłoszeń na 676 debat.
Rozmiar zestawu danych :
3.15 MiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 2259 |
- Struktura funkcji :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| _argument_zdania | Sekwencja | |||
| _argument_zdania/klucz | Napinacz | strunowy | ||
| _argument_zdania/wartość | Napinacz | strunowy | ||
| _prawo | Napinacz | strunowy | ||
| _identyfikator_roszczenia | Napinacz | strunowy | ||
| _nazwa_debaty | Napinacz | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised):('_argument_sentences', '_claim')Przykłady ( tfds.as_dataframe ):