resúmenes_de_opinión

Descripción :

Hay dos subconjuntos de datos:

(1) RottenTomatoes: los críticos de cine y el consenso se rastrearon desde http://rottentomatoes.com/ Tiene campos de "_movie_name", "_movie_id", "_critics" y "_critic_consensus".

(2) IDebate: Los argumentos rastreados desde http://idebate.org/ Tiene campos de "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences".

Consulte también https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt

Página de inicio : https://web.eecs.umich.edu/~wangluxy/data.html
Código fuente : tfds.datasets.opinion_abstracts.Builder
Versiones :
- 1.0.0 (predeterminado): Sin notas de la versión.
Tamaño de descarga : 20.08 MiB
Almacenamiento automático en caché ( documentación ): Sí
Figura ( tfds.show_examples ): no compatible.
Cita :

@inproceedings{wang-ling-2016-neural,
    title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
    author = "Wang, Lu  and
      Ling, Wang",
    booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
    month = jun,
    year = "2016",
    address = "San Diego, California",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/N16-1007",
    doi = "10.18653/v1/N16-1007",
    pages = "47--57",
}

opinion_abstracts/rotten_tomatoes (configuración predeterminada)

Descripción de la configuración : críticos profesionales y consenso de 3.731 películas.
Tamaño del conjunto de datos : 50.10 MiB
Divisiones :

Dividir	Ejemplos
`'train'`	3,731

Estructura de características :

FeaturesDict({
    '_critic_consensus': string,
    '_critics': Sequence({
        'key': string,
        'value': string,
    }),
    '_movie_id': string,
    '_movie_name': string,
})

Documentación de características :

Característica	Clase	Tipo D
	CaracterísticasDict
_critic_consensus	Tensor	cadena
_criticos	Secuencia
_críticos/clave	Tensor	cadena
_críticas/valor	Tensor	cadena
_movie_id	Tensor	cadena
_nombre de pelicula	Tensor	cadena

Claves supervisadas (Ver como_documento as_supervised ): ('_critics', '_critic_consensus')
Ejemplos ( tfds.as_dataframe ):

opinion_abstracts/idebate

Descripción de la configuración : 2259 reclamos para 676 debates.
Tamaño del conjunto de datos : 3.15 MiB
Divisiones :

Dividir	Ejemplos
`'train'`	2,259

Estructura de características :

FeaturesDict({
    '_argument_sentences': Sequence({
        'key': string,
        'value': string,
    }),
    '_claim': string,
    '_claim_id': string,
    '_debate_name': string,
})

Documentación de características :

Característica	Clase	Tipo D
	CaracterísticasDict
_argumento_frases	Secuencia
_argumento_frases/clave	Tensor	cadena
_argumento_frases/valor	Tensor	cadena
_afirmar	Tensor	cadena
_claim_id	Tensor	cadena
_debate_nombre	Tensor	cadena

Claves supervisadas (ver como_documento as_supervised ): ('_argument_sentences', '_claim')
Ejemplos ( tfds.as_dataframe ):

resúmenes_de_opinión Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

opinion_abstracts/rotten_tomatoes (configuración predeterminada)

opinion_abstracts/idebate

resúmenes_de_opinión